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مقدمة: 


تطوير المقاييس مجال يتطور بسرعة مع ظهور مناهج جديدة واكتساب المزيد من 
القوة. وقد نشأت هذه التغييرات من مجموعة متنوعة من المصادرء ما في ذلك الجهود 
الكبيرة لتوفير المزيد من أدوات القياس الموحدة بشكل أكبر عبر مجموعة واسعة من 
السياقات. فمن deol‏ تتسم هذه التغييرات بالأهمية والإثارة. ومن ناحية أخرىء WB‏ 
تجعل مراجعة وتنقيح هذا الكتاب تحدياً إلى حد كبير. وكما هو الحال مع الإصدارات أو 
الطبعات السابقة, فإن هدفي هو تقديم معلومات دقيقة أو معقدة Äi hs‏ يمكن لمجموعة 
من الباحثين الوصول إليها. وفي الوقت duii‏ ومع كل مراجعة وتنقيح» حاولت جاهداً 
تحديث المادة العلمية لتعكس الاتجاهات الحالية في هذا ا مجال. ويتعارض Glia‏ الهدفان 
في بعض الأحيان تعارضاً Lb‏ حيث إن بعض التطورات الجديدة تنطوي على مفاهيم 
ومنهجيات متقدمة ومتخصصة نوعاً ما. وقد سعيت إلى حل هذه المعضلة عن طريق توفير 
سياق للتطورات dated!‏ وعن طريق التمييز بشكل واضح بين أنشطة القياس المحدودة 
والضيقة وأنشطة القياس الأوسع نطاقًا agile‏ وا مداخل التقنية التي يمكن أن تناسب YS‏ 
منها. وبطبيعة الحال» فقد اقتصرت مناقشتي لهذه القضايا والمسائل على سياق نطاق الكتاب 
وهدفه الذي يعد بمثابة نظرة dole‏ على الهج السيكومترية بدلاً من المراجعة الشاملة. 

وكانت المحصلة النهائية هي أن كل فصل يحتوي على مادة جديدة مضافة إليه. في 
الفصل oi!‏ نظرة dole‏ يتضمن مراجعتي واستعراضي لتاريخ القياس الآن ملخصًا لكيفية 
تصنيف الأمراض العقلية من العصور القدهة إلى الوقت الحاضرء مع التركيز على الأنشطة 
الأكثر حداثة. ويكشف هذ النقاش عن الفرص الضائعة وغيرها من الفرص التي تم 
استغلالها. 

في الفصل الثاني» فهم المتغير الكامنء قمت بإضافة قسم يتناول بشكل مباشر أكبر الآثار 
المترتبة على اختيار النموذج السببي الذي يربط البنود بمتغيراتها الكامنة. وقد لاحظت أن 
هذا الاعتبار لمهم والواضح على ما يبدو كثيراً ما يتم تجاهله وإغفاله. وبعض النماذج التي 
تربط المتغيرات بمؤشراتها تكون أكثر ملاءمةً gl‏ القياس المباشرة أكثر من غيرها. thing‏ على 
ذلك» أعتقد أن هذه النقطة تستدعي وتحتاج مزيداً من التركيز. 
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وتمثل التغييرات في الفصل OLY! CWI‏ التطور السريع في التفكير في بعض مجالات 
القياس. وقد ظهرت في السنوات الأخيرة مجموعة كبيرة من الأعمال التي تشكك في استخدام 
معامل «كرونباخ ألفا». وعلى الرغم من أنني قد أشرت إلى هذه المنظورات الجديدة في 
الطبعة السابقة» إلا أنني قد شعرت بالحاجة إلى التوسع في تلك المناقشة في الطبعة الحالية 
من الكتاب. وهذا يتضمن تسليط الضوء على بعض الانتقادات والظروف التي تنطبق 
عليهاء فضلاً عن مناقشة أكثر تفصيلاً لبعض بدائل معامل «ألفا». مثل معامل»أوميغا» 
والذي اكتسب قدراً أكبر من الاعتراف. وقد حاولت أن أحافظ على أن تكون هذه المناقشة 
في المقام الأول مفاهيمية ونظرية وليست رياضيةء وبدلاً من تكريس أو تخصيص الصفحات 
للعمليات الحسابية التفصيلية» فقد وجّهت القراء إلى المصادر التي ستساعدهم في استخدام 
أدوات مثل معامل «أوميغا» إذا اختاروا ذلك. لقد قمت أيضاً بإضافة مناقشة حول مدى 
OLS‏ درجات التغيير GAS dig wohl‏ بين درجتين من مقياس واحد تم تطبيقه أكثر من 
مرة. وألخص من الناحية النظرية ماهية OLS‏ درجة التغييرء وأسلط الضوء على الظروف 
عندما يكون في استخدامها Uin‏ وأقترح أساليب تحليلية توفر بعض الحماية ضد الثبات 
المخفف الناشئ عن استخدام درجات التغيير الأولية أو الخام. 

في الفصل الرابع» Stall‏ قمت بتوسيع نطاق معالجتي لصدق ال محتوى بشكل كبير. وأؤكد 
على أهمية الحفاظ على علاقة وثيقة بين المتغير محل الاهتمام والمقياس المستخدم لقياسه 
كمياً. كما أناقش أيضاً المخاطر المحتملة لوضع مفهوم للمتغير على نطاق أوسع من اللازم. 

وف الفصل الخامسء القواعد الإرشادية لتطوير المقياس» قدمت عدداً قليلاً من اممسائل Lol‏ 
مزيداً من التركيز أو قدمت مزيداً من التفاصيل إلى حد ما. وحاولت أيضاً ربط المسائل العملية 
التي يركز عليها هذا الفصل ببعض المسائل المفاهيمية «النظرية» المثارة في فصول أخرى. 


في الفصل السادس» التحليل العاملي» واجهت مرة أخرى معضلة الموازنة بين الأنشطة 
الجديدة iagt‏ في هذا المجال وبين الحفاظ على الأمور لتكون في متناول القارئ وسهلة 
القراءة. وف النهاية» اخترت إضافة قسم جديد حول نموذج ثنائي العوامل -bifactor‏ ولقد 
فعلت ذلك لأنه فيما يبدو أصبح يستخدم على نطاق أوسع لتقيبم المتغيرات المعقدة 
أو المركبة التي تشتمل على جوانب أكثر عمومية وأكثر تحديداً. ولا تهدف تغطيتي إلى 
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جعل القراء محللين مقتدرينء بل فهم سبب مواجهتهم لهذا النموذج E5969)‏ العامل 
الهرمي امماثل من الناحية المفاهيمية) في قراءتهم. وعلى وجه الخصوص في النهج AEI‏ 
على نظرية استجابة tid!‏ يمكن للنماذج ثنائية العوامل أن تخدم غرضاً محدداً (المساعدة 
على تحقيق أحادية البعد) والتي شعرت أنه يستحق بعض التوضيح والتفسير. 

يقدم الفصل السابع مرة أخرى نظرة عامة على نظرية استجابة البند. وكما فعلت مع 
الفصل السادس» واجهت DS‏ بشأن ما يجب تضمينه ومعالجته» وكنت أرغب ف إضافة 
المزيد من التفاصيل مع الحفاظ على الأسلوب وا مسار العام للكتاب. لقد اخترت تقديم 
مناقشة جديدة حول theta kò‏ أي قوة السمة التي يجري تقييمهاء ودورها في اختبار 
ASI‏ المحوسب (CAT) computerized adaptive testing‏ وم يصبح اختبار ASA)‏ 
المحوسب CAT‏ أكثر انتشارًا فحسب» بل إنه» في بعض النواحي» هثل وسيلة مختصرة 
لتلخيص بعض الاختلافات بين نظرية استجابة البند 1۸1 والثهج الكلاسيكية للقياس. 

يناقش الفصل الثامن مرة أخرى القياس في السياق الأوسع. وكما فكرت في العديد من 
التغييرات في نهج القياس التي طرأت على أساليب القياس منذ ظهور الطبعة الأولى من هذا 
الكتاب» فقد أدهشتني حقيقة أن العديد منها قد cle‏ نتيجة لجهود القياس واسعة النطاق 
large-scale measurement efforts‏ هذه الجهود جديرة بالاهتمام ومهمة ولكنها على 
الأرجح ليست نوع القياس الذي سيشارك فيه معظم الباحثين. Mg‏ شعرت أنه سيكون 
من المفيد مقارنة «القياس الصغير» مع «القياس الكبير». وأؤكد في هذا الصدد على أن 
كليهما قادر على توفير معلومات ذات مغزى وأن لكل منهما مزاياه وعيوبه. كما أؤكد على 
أن إبقاء هذه الاختلافات في الاعتبار منذ بداية مشروع القياس سيزيد في كثير من الأحيان 
من احتمال النجاح ويمكن أيضاً أن يجعل المهمة أسهل بكثير بطرق مختلفة. 

كما قمت بإضافة تمارين إضافية في نهاية الفصول. وآمل أن تساعد هذه التمارين القراء 
على تقييم فهمهم للمواد. وأن تحفزهم أيضاً على مناقشة القضايا المهمة. 

لقد احتفظت بل ميزات التي وجدها القراء مفيدة للغاية في الطبعات السابقة. وهذا 
يعني أن التركيز يظل في المقام الأول على المفاهيم بدلاً من العمليات الحسابية. وكما هو 
الحال في الطبعات السابقةء فإن المساحة المحدودة التي أكرسها للصيغ والمعادلات ينبغي أن 
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تساعد القراء على رؤية ما هو أبعد من الحروف والرموز اليونانية لفهم المفاهيم التي تعبر 
عنها تلك الصيغ. وكلما كان ذلك ممكناً أستخدم التشبيهات لشرح العلاقات بين المفاهيم 
وهو النهج ysl al‏ الذي GS)‏ القراء السابقون أنه مفيد. لذلك؛ ففي حين تمت إضافة 
المزيد من الممواد «الموضوعات» المتقدمة من أجل إبقاء القراء على اطلاع على الاتجاهات 
الجديدة في القياس» فقد بذلت قصارى جهدي للحفاظ على إمكانية الوصول إلى الطبعات 
السابقة وسهولة قراءتها. 


شكر وتقدير: 

ترغب شركة SAGE Publishing‏ في الاعتراف بالمساهمات القيمة التي قدمها ال مراجعون 
التالية أسماؤهم: جوري كولبرت - جيرتز Jorie Colbert-Gertz‏ كلية جونز هوبكنز 
للتعليم؛ وستيفن دبليو ديتمور Stephen W. Dittmore‏ جامعة أركنساس؛ غاري دي 
إيليس Gary D. Ellis‏ جامعة تكساس إيه آند إم؛ جوستين جروس Justin H. Gross‏ 
جامعة ماساتشوستس أمهيرست؛ بنيامين هيل Benjamin D. Hill‏ جامعة جنوب LLY]‏ 
وجوزيف كوش Joseph C. Kush‏ جامعة دوكين. 


نبذة عن المؤلف: 

قبل تقاعده في عام WIV‏ عمل روبرت ف. ديفيليس أستاذاً في قسم السلوك الصحي 
(كلية جيلينجز للصحة العامة العالمية (Gillings School of Global Public Health‏ في 
جامعة نورث كارولينا في تشابل هيل. يتمتع الدكتور ديفيليس بخبرة تزيد عن Lele Yo‏ 
في قياس المتغيرات النفسية والاجتماعية» وقد كان عضواً نشطاً في اتحاد نظام معلومات 
قياس نتائج تقارير المرضى (PROMIS)‏ وهو عبارة عن مبادرة لخارطة طريق للمعاهد 
الوطنية للصحة (NIH)‏ متعددة المواقع تهدف إلى تحديد وتعديل واختبار ونشر المقاييس 
النهائية لاستخدامها من قبل باحثي المعاهد الوطنية للصحة. وكان دوره في اتحاد نظام 
معلومات قياس نتائج تقارير ا مرضى كرئيس مجال الشبكة الواسعة للنتائج وا مخرجات 
الاجتماعية. كما عمل في مجلس إدارة شعبة علم النفس الصحي التابع للجمعية الأمريكية 
لعلم النفس (TA)‏ وقي قسم دراسات البحوث السريرية/النتائج/العلاجية التابع ممؤسسة 
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التهاب المفاصل ”الروماتيزم“» وقي ال مجلس الاستشاري لبادرة التميز في قياس شؤون 
المحاربين القدامى» وقد حصل على جائزة العام المتميز لعام ٠٠١0‏ من جمعية ال متخصصين 
في أمراض الروماتيزم» وهو محرر مشارك لرعاية وبحوث التهاب اللمفاصل. بالإضافة إلى ذلك 
عمل كمحرر زائرء أو محرر مشارك زائرء أو مراجع لأكثر من عشرين مجلة أخرى. وقد عمل 
كباحث رئيسي أو باحث مشارك منذ أوائل الثمانينيات في سلسلة من المشروعات البحثية 
التي تمولها الحكومة الاتحادية والمؤسسات الخاصة: وما زال يعمل بشكل نشط في دوره 
التحريري وكمستشار في مجموعة متنوعة من المشاريع. 
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الفصل الأول 
نظرة عامة 


يُعد القياس من الأمور الحيوية عبر طائفة واسعة من سياقات البحوث الاجتماعية. 

على سبيل Sb!‏ فر في الحالات الافتراضية التالية: 

-١‏ تواجه المتخصصة في علم النفس الطبي معضلة شائعة: مقياس القياس الذي تحتاجه 
غير موجود على ما يبدو. وتتطلب دراستها أن يكون لديها مقياس يستطيع أن يفرق 
ويميز بين ما يريد الأفراد حدوثه وما يتوقعون أن يحدث عندما يرون طبيباً. وتبين 
أبحاثها أن الدراسات السابقة استخدمت المقاييس التي أربكت وأثارت بدون قصد 
هاتين الفكرتين. ولا يبدو أن المقاييس الموجودة تقوم بهذا التمييز على وجه التحديد 
بالطريقة التي تريدها المتخصصة في علم النفس الطبي. وعلى الرغم من أنها تستطيع 
تكوين وإنشاء بعض الأسئلة التي يبدو إمكانية الاستفادة منها في التمييز بين ما يريده 
الفرد وما يتوقعه. فإنها تخشى من أن البنود أو الأسئلة «التي تم تكوينها» قد لا تكون 
مؤشرات موثوقة وصالحة لهذه المفاهيم. 

-Y‏ أن ا متخصص في علم الأوبئة غير متأكد من LAS‏ المضي قدماً والمتابعة. وهو يجري 
تحليلات ثانوية بشأن مجموعة كبيرة من البيانات تستند إلى دراسة استقصائية وطنيه 
بشأن الصحة. وقال إنه يود أن يفحص العلاقة بين جوانب معينة من الإجهاد (الضغط) 
النفسي ا مدرك والحالة الصحية. على الرغم من عدم تضمين مجموعه من البنود التي 
تم تصميمها كمقياس للإجهاد أو الضغط النفسي في الدراسة الاستقصائية ALM‏ إلا أن 
العديد من البنود التي كانت تهدف في الأصل إلى قياس متغيرات أخرى يبدو أنه يمكن 
الاستفادة من محتواها المرتبط بالضغط النفسي. وقد يكون من الممكن تجميع هذه 
البنود في مقياس يتمتع بالثبات والصدق لقياس الإجهاد أو الضغط النفسي. ومع ذلك 
إذا كانت البنود المجمعة تشكل مقياساً ضعيفاً للإجهاد النفسيء فقد Logis‏ الباحث 
إلى استنتاجات Abe‏ 


تطوير المقاييس: النظرية والتطبيق ys‏ 


الفصل الأول 


-Y‏ يشعر فريق التسويق بالإحباط في محاولاته لتخطيط حملة لخط أو مجموعة جديدة من 
ألعاب الأطفال الرضع عالية السعر. وقد أشارت مجموعات التركيز (focus groups)‏ إلى 
أن قرارات الشراء التي يتخذها الآباء تتأثر بشده بالأهمية التعليمية الظاهرة للألعاب 
من هذا النوع. ويعتقد فريق التسويق أن الآباء الذين لديهم طموحات وتطلعات 
تعليمية ومهنية عالية لأطفالهم الرضع سيكونون أكثر اهتماماً وانجذاباً لهذا الخط 
الجديد من الألعاب. ولذلك» يرغب فريق التسويق في تقييم هذه التطلعات ضمن 
عينه كبيره ومنتشرة Wil eo‏ من الآباء. وتعتبر مجموعات التركيز الإضافية مرهقة 
للغاية للوصول إلى عينة كبيرة بما فيه الكفاية من المستهلكين. 
في كل حالة من هذه الحالات» يواجه الأشخاص المهتمون ببعض المجالات العلمية 

مشكلة تتعلق بالقياس. ولا يهتم أي من هؤلاء الباحثين في المقام الأول بالقياس في حد ذاته. 

ومع ذلك» يجب على كل منهم أن يجد وسيلة لقياس ظاهره معينة قبل التصدي لتحقيق 

هدف البحث الرئيسي. وفي كل Ale‏ تكون أدوات القياس «الجاهزة أو المتوفرة» إما غير 
مناسبة أو غير dole‏ ويدرك جميع الباحثين أن تبني مناهج القياس العشوائية ينطوي على 
مخاطر إنتاج بيانات غير دقيقة. Why‏ فإن تطوير أدوات القياس الخاصة بهم يبدو أنه 

هو الخيار الوحيد المتبقي أمامهم. 
وقد واجه العديد من الباحثين في العلوم الاجتماعية مشاكل مماثلة. وتتمثل إحدى 

الاستجابات الشائعة للغاية لهذه الأنواع من المشاكل في الاعتماد على الأدوات القائمة 

المشكوك في ملاءمتها. وهناك طريقة أخرى للاستجابة لهذه المشاكل تتمثل في افتراض أن 

بنود الاستبيان المطورة Éa‏ «التي تبدو سليمة وصحيحة» ستقوم بعمل قياس مناسب. 

ومن الأعذار الشائعة لضعف إستراتيجيات القياس هي عدم الارتياح أو عدم الإلمام بأساليب 

ghs‏ أدوات قياس تتمتع بالثبات والصدق وعدم إمكانية الوصول إلى المعلومات العملية 
حول هذا الموضوع. وقد تؤدي محاولات الباحثين الرامية إلى اكتساب مهارات تطوير 
القياس إلى توجيههم إما إلى مصادر غامضة مخصصة أساساً للمتخصصين في القياس أو إلى 
المعلومات التي تكون dale‏ جداً بحيث لا تكون مفيدة» وتم إعداد هذا الكتاب ليكون بديلاً 
لتلك الخيارات. 


vy‏ تطوير المقايبس: النظرية والتطبيق 


dole نظرة‎ 


المنظورات العامة بشأن القياس: 

بعد القياس blis‏ أساسياً للعلوم. ونحصل على المعرفة حول الأشخاص. والأشياء 
والأحداث» والعمليات من خلال ملاحظتها ورصدهاء ويتطلب فهم هذه الملاحظات 
باستمرار قياسها بصورة كمية (بمعنى أننا نقيس الأشياء التي نهتم بها من الناحية العلمية). 
وتتفاعل عملية القياس والأسئلة العلمية الأوسع نطاقاً التي تخدمها مع بعضها البعضء 
وغالباً ما تكون الحدود lyin‏ غير ملحوظة, ويحدث dia‏ على سبيل JEL‏ عندما يتم 
اكتشاف كيان جديد أو تنقيحه في سياق القياس أو عندما يفسر المنطق الذي ينطوي عليه 
تحديد LAS‏ القياس الكمي لظاهرة موضع الاهتمام في ضوء الظاهرة نفسها. فمثلاً قام 
سميثء. 9 yp!‏ وديفيليس )1995 Gow (Smith, Earp, and DeVellis,‏ تصورات slut]‏ 
بشأن الضرب. وقد اقترح نموذج تصوري (مفاهيمي) مسبق قائم على التحليل النظري 
ستة مكونات متميزة لهذه التصورات. وقد أشار العمل التجريبي والذي استهدف تطوير 
مقياس لقياس هذه التصورات إلى أنه - بين النساء GW!‏ تعرضن للضرب والنساء GU)‏ م 
يتعرضن له - كانت هناك تصورات أبسط بكثير هي السائدة: لقد شرح مفهوم واحد بدقة 
كيف استجابت النساء المشاركات في الدراسة إلى ۳۷ بنداً من ٠٠ Lol‏ بنداً تم استخدامها. 
وتشير هذه النتيجة إلى أن ما اعتبره الباحثون مجموعة معقدة من المتغيرات كانت تنظر 
إليه النساء GW!‏ يعشن بالمجتمع المحلي في الواقع أنه ظاهرة واحدة أوسع نطاقاً. وهكذاء 
فإنه في سياق استنباط وسيلة لقياس تصورات النساء حول الضرب» اكتشفنا شيئاً جديداً 
حول بنية تلك التصورات. 

ويقول دانكن )1984 (Duncan,‏ إن جذور القياس تكمن في العمليات الاجتماعية. 
وأن هذه العمليات وقياسها في الواقع تسبق العلم: ”كل القياس ... هو قياس اجتماعي. 
والمقاييس المادية طُوّرت لأغراض اجتماعية“ (ص (PO‏ وفي إشارة إلى عمليات القياس 
الاجتماعي الرسمية BSL!‏ مثل التصويت وإجراء التعداد» ونظم التقدم الوظيفي» ذكر 
«دانكن» أن أصولها تبدو وكأنها تمثل محاولات لتلبية الاحتياجات الإنسانية اليومية» وليس 
مجرد تجارب أجريت لتلبية الفضول العلمي. وقد ذهب إلى القول بأنه يمكن استخلاص 
عمليات مماثلة. 
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الفصل الأول 


في تاريخ الفيزياء: فقد تم قياس الطول أو المسافة وال مساحة والحجم 
والوزن والوقت من قبل الشعوب القديمة في سياق حل المشكلات العملية 
والاجتماعية» وقد Cuts‏ العلوم الفيزيائية على أسس تلك الإنجازات (ص .)٠١١‏ 


ومهما كانت الدوافع الأوليةء فإن كل مجال من مجالات العلوم يطور مجموعه إجراءات 
القياس الخاصة a‏ فقد طور علم الفيزياءء على سبيل JELI‏ أساليب ومعدات متخصصة 
للكشف عن الجزيئات شبه الذرية. وف إطار العلوم السلوكية والاجتماعية» تطور القياس 
النفسي (psychometrics)‏ كتخصص فرعي معني بقياس الظواهر النفسية والاجتماعية. 
doles‏ ما يكون إجراء القياس المستخدم هو الاستبانة» وتشكل متغيرات الاهتمام جزءاً من 
إطار نظري أوسع نطاقاً. 


الأصول التاريخية للقياس في العلوم الاجتماعية: 


أمثله مبكرة: 

المنطق السليم والسجل التاريخي يؤيدان ادعاء دنكان (Duncan)‏ بأن الضرورة 
الاجتماعية أدت إلى تطوير القياس قبل ظهور العلم. ولا شك أن بعض أشكل القياس 
كانت جزءاً من ذخيرة الأنواع لدينا منذ عصور ما قبل التاريخ. فالبشر الأوائل لابد أنهم 
استطاعوا تقدير الأشياء وا ممتلكات والخصوم (المعارضين) على أساس خصائص مثل الحجم. 
ويذكر «دنكان» )1984( Duncan‏ إشارات الكتاب المقدس في الاهتمام بالقياس (على سبيل 
ا مشالء ”التوازن الزائف هو رجس (مكروه) عند الرب» ولكن الوزن العادل هو فرحه“ 
الأمثال .)١١:١‏ ويلاحظ أن كتابات أرسطو تشير إلى المسؤولين المكلفين بالتحقق من الأوزان 
والقياسات. وتلاحظ اناستاسي )1968( Anastasi‏ أن أسلوب سقراط socratic‏ المستخدم 
في اليونان القديمة ينطوي على البحث عن الفهم بطريقة يمكن اعتبارها اختباراً للمعرفة. 
a:‏ ب. — ديبوا P. H. DuBois‏ في مقالة له عام 1176 (أعيد طبعها في بارنیت» 
(VAVI‏ استخدام اختبار الخدمة المدنية في وقت مبكر يصل إلى 7٠٠١‏ قبل الميلاد في الصين. 
ويستشهد رايت )1999( Wright‏ بأمثله أخرى على الأهمية التي أولتها العصور القديمة 
لعملية القياس الدقيقء ما في ذلك ”وزن سبعة أمثال“ “weight of seven”‏ الذي استندت 
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إليها الضرائب الإسلامية في القرن السابع. كما يشير أيضاً إلى أن البعض ربط الثورة الفرنسية, 
جزئياًء بالفلاحين الذين سئموا من ممارسات القياس غير العادلة. 

إن الفكرة القائلة بأن القياس يمكن أن ينطوي على خطأ وأنه هكن اتخاذ خطوات 
معينة للحد من ذلك الخطأ asi‏ رؤية أحدث. وقد أشار «بوتشوالد» )2006( Buchwald‏ 
في استعراضه لتناقضات القياس وتأثيرها على ال معرفة: إلى أنه على الرغم من أنه لا يزال في 
العشرينيات من عمره في أواخر الستينيات من القرن السادس عشر وبداية السبعينيات 
من القرن السادس عشرء كان ”إسحاق نيوتن“ على ما يبدو هو أول من استخدم متوسط 
ملاحظات متعددة, وكان قصده إنتاج مقياس أكثر دقة عندما أسفرت ملاحظاته عن 
الظواهر الفلكية عن قيم متناقضة. ومن امثير للاهتمام أنه م يوثق استخدام ا متوسطات 
في تقاريره الأولية ولكنه أخفى اعتماده عليها لعقود. وقد يكون هذا الإخفاء ناجماً عن 
نقص وانعدام النزاهة أقل مما نشأ من مجرد الفهم المحدود Lhal‏ ودوره في القياس. 
وتعليقاً على استخفاف مماثل bled‏ فلك آخر بالنسبة للملاحظات المتناقضة: يقول «ألدر» 
(Alder, 2002)‏ إنه حتى في أواخر القرن الثامن عشرء لم يكن إخفاء التناقض في الملاحظة 
”شائعاً فقطء بل كان يُعتبر lio‏ لصاحب العلم أو الموهبة. وكان Ad‏ إلى الخطأ على أنه 
فشل أخلاقي“ (ص )+( وقد خلص «بوتشوالد» )2006 (Buchwald,‏ إلى ملاحظة مماثلة: 

[طريقة عمل العلماء في القرن السابع عشر وأوائل القرن الثامن عشر] 
لا تعتبر الاختلافات نواتج ثانوية حتمية لعملية القياس نفسهاء بل So‏ على 
مهارة فاشلة أو غير كافية. ومن المحتمل أن يكون الخطأ في القياس مختلفًا 
قليلاً عن السلوك الخاطئ من أي نوع إذ هكن أن يترتب عليه عواقب 
أخلاقية» وينبغي إدارته بطرق مناسبة (صفحة (OV‏ 

م يكن علماء الفلك الوحيدين الذين يقومون بعمليات رصد منتظمة للظواهر الطبيعية 
في أواخر القرن السابع عشر وأوائل القرن الثامن عشر. ففي الستينيات من القرن السادس 
عشرء كان ”جون جراونت“ (John Graunt)‏ يقوم بتجميع معدلات الولادة والوفاة من 
سجلات التعميد والدفن في مدينة هامبشاير (Hampshire)‏ بإنجلترا. واستخدم ”جراونت“ 


أسلوب حساب المتوسط (على الرغم من أنه ليس الاستخدام الشائع في هذا الوقت) 
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لتلخيص النتائج التي توصل إليها. ووفقًا لبوتشوالد )2006( Buchwald‏ كان دافع 
Graunt‏ لاستخدام المتوسط هو الحصول على قيمة ”حقيقية“ آنية. وكانت الفكرة هي أن 
نسبة المواليد إلى الوفيات تمتثل لبعض قوانين الطبيعةء غير أن الأحداث التي لا هكن التنبؤ 
بها والتي قد تحدث في أي سنة معينة سوف تخفي تلك الحقيقة الأساسية. إن وجهة النظر 
هذه للملاحظة كنافذة غير مكتملة في حقائق الطبيعة تشير إلى تطور متزايد في كيفية النظر 
إلى القياس: بالإضافة إلى القيود التي يفرضها الملاحظء فإنه يمكن أيضاً لعوامل أخرى أن 
تفسد المعلومات التي يتم جمعها تجريبياًء وقد تكشف بعض التعديلات التي أدخلت على 
هذه القيم على نحو أكثر دقة عن الطبيعة الحقيقية للظاهرة محل الاهتمام. 

وعلى الرغم من هذه الرؤى المبكرةء فإنه بعد قرن من الزمن من استخدام ”نيوتن“ 
لأول مرة لأسلوب المتوسط قبل أن يدرك العلماء على نطاق أوسع أن جميع القياسات كانت 
عرضة للخطأ وأن أسلوب المتوسط سوف يقلل من مثل هذا الخطأ )2006 (Buchwald,‏ 
Lids‏ للفيزيائي والمؤلف ”ليونارد مولودينو"“ )2008( Leonard Mlodinow‏ في أواخر 
القرن الثامن عشر وأوائل القرن التاسع عشرء أجبرت التطورات في علم الفلك والفيزياء 
العلماء على الاقتراب من الخطأ العشوائي بشكل أكثر منهجية. مما أدى إلى ظهور 
الإحصاء الرياضي .(mathematical statistics)‏ وبحلول عام ۱۷۷۷ء قارن دانييل برنولي 
«Daniel Bernoulli»‏ (ابن شقيق جاكوب برنولي «Jakob Bernoulli»‏ الأكثر شهرة) 
توزيعات القيم التي تم الحصول عليها من الملاحظات الفلكية على مسار سهام الرمي 
.(archer’s arrows)‏ وتكتلت أو تجمعت حول نقطة مركزية تقل بشكل تدريجي على 
مسافات أكبر من ذلك المركز. وعلى الرغم من أن المعالجة النظرية التي رافقت تلك 
ا لملاحظة كانت خاطئة في بعض النواحيء إلا أنها تمثل بداية تحليل رسمي للخطأ في 
القياس )2008 .(Mlodinow,‏ ويجادل ”بوتشوالد“ )2006( Buchwald‏ بأن أحد العيوب 
الأساسية في تفسيرات القرن الثامن عشر Lhe‏ في القياس هو الفشل في التمييز بين 
الخطأ العشوائي والخطأ المنتظم. وحتى بزوغ فجر القرن التالي Gow‏ يظهر Rad‏ أكثر دقة 
للعشوائية. ومع هذا الفهم المتزايد للعشوائية cle‏ التقدم في القياس؛ ومع تقدم القياسء 
تقدم العلم أيضاً 
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ظهور الأساليب الإحصائية ودور الاختبارات العقلية: 


يدعم منظور «نونالي» )1978( Nunnally‏ الرأي القائل بأن الفهم الأكثر تطوراً 
للعشوائية والاحتمالات والإحصاء كان ضروريًا لازدهار القياس» ويقول إنه على الرغم 
من أن الملاحظات ال منتظمة رها كانت مستمرة؛ OÈ‏ عدم وجود طرق إحصائية رسمية 
بدرجة أكبر قد أعاق تطوير علم لقياس القدرات البشرية حتى النصف الأخير من القرن 
التاسع عشر. وقد بدأ تطوير الأساليب الإحصائية ا مناسبة في القرن التاسع pis‏ في النهاية 
من خلال مشروع ”داروين“ Darwin‏ بشأن التطور وملاحظته وقياس التباين المنتظم 
عبر الأنواع. وقام ابن عم داروينء السير ”فرانسيس غالتون“ Francis Galton‏ بتوسيع 
الملاحظة المنسقة للاختلافات إلى البشر. وكان اهتمام ”غالتون“ الرئيسي هو وراثة الصفات 
التشريحية والفكرية. وكان ”كارل بيرسون“ Karl Pearson‏ الذي يعتبره الكثيرون 
”مؤسس الإحصاء“ (على سبيل JEL‏ ألين وين 3 .م ,1979 Feo Slo} (Allen& Yen,‏ 
لجالتون. وطور بيرسون الأدوات الرياضية - بما في ذلك معامل ارتباط حاصل ضرب العزوم 
(Product-Moment Correlation Coefficient)‏ والذي يحمل اسمه. أي معامل ارتباط 
بيرسون - اللازمة لفحص ودراسة العلاقات بين المتغيرات بشكل منتظم. هكن للعلماء بعد 
ذلك أن يحددوا مدى الترابط بين الخصائص القابلة للقياس. واستمر ”تشارلز سبيرمان» 
Charles Spearman‏ في تقليد أسلافه ومهد الطريق للتطوير اللاحق وتعميم التحليل 
العاماي لاحقاً في أوائل القرن العشرين. ومن الجدير SUL‏ أن العديد من المساهمين 
الأوائل في القياس الرسمي Le)‏ في ذلك ألفريد بينيه Alfred Binet‏ الذي zgb‏ اختبارات 
القدرة العقلية في فرنسا في أوائل القرن العشرين) قد تقاسموا الاهتمام بالقدرات الفكرية. 
lbs‏ تم تطبيق الكثير من العمل المبكر في القياس النفسي على ”الاختبار العقلي“. 


دور علم النفس الفسيولوجي: 


Las‏ رافد تاريخي آخر للقياسات النفسية الحديثة من ale‏ النفس الفسيولوجي. 
وكما Lal‏ كانت مشالل القياس شائعة في علم الفلك والعلوم الطبيعية الأخرى وكانت 
مصدراً لاهتمام العام إسحاق نيوتن (بوتشوالد., 2006 ele gä (Buchwald,‏ النفس 
الفسيولوجي عند التقاء علم النفس والفيزياء ويهتم بالروابط والصلات بين الخصائص 
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الفيزيائية للمحفزات أو المثيرات وكيف يدركها البشر وينظرون إليها. إن محاولات تطبيق 
إجراءات القياس المتبعة في الفيزياء على دراسة المشاعر (الأحاسيس) أدت إلى نقاش طويل 
حول طبيعة القياس. وقد لخصت ”نارينس ولوسي“ )1986 (Narens and Luce,‏ هذه 
القضايا والمسائل. فقد لاحظ الباحثان أنه في أواخر القرن التاسع عشرء لاحظ هيلمهولتز 
(Helmholtz)‏ أن الخصائص الفيزياتية (الطبيعية). مثل الطول والكتلة, تمتلك نفس البنية 
الرياضية (mathematical)‏ الحقيقية مثلها مثل الأعداد الحقيقية الموجبة". على سبيل 
المثالء فإن وحدات الطول والكتلة يمكن ترتيبها والإضافة إليها مثل الأعداد العادية. وف 
أوائل القرن العشرينء استمر النقاش» واعتبرت الجمعية البريطانية لتقدم العلوم (للنهوض 
بالعلم) أن القياس الأساسي للمتغيرات النفسية يُعد أمراً مستحيلاً بسبب المشكلات الكامنة 
في ترتيب أو إضافة تصورات حسية أو إدراكية. جادل «ستيفنز» Stevens)‏ .5 .5) أن 
قابلية الجمع / الإضافة» التي تنطبق على الطول أو ALSI‏ ليست ضرورية وأشار إلى 
أنه هكن للأفراد إصدار أحكام متسقة إلى حد ما على شدة (قوة) الصوت. على سبيل 
المثالء فالأفراد يمكنهم الحكم على صوت ما بأنه أعلى من صوت آخر lide‏ الضعف 
أو النصف. وقال ”ستيفنز“ إن خاصية النسبة هذه GEE‏ من إخضاع البيانات ا لمستمدة 
من هذه القياسات للمعالجة الرياضية. وينسب إلى ”ستيفنز“ تصنيف المقاييس إلى اسمية 
(nominal)‏ وترتيبية (ordinal)‏ وفترية (interval)‏ ونسبية (ratio)‏ وقال إن الحكم 
على قوة أو شدة الصوت تتوافق مع مقياس النسبة )1984 «Duncan,‏ وفي الوقت الذي 
كان فيه ”ستيفنز“ يقدم حججه حول مشروعية قياس القياسات السيكولوجية» كان J.J”‏ 
ثورستون" (L. L. Thurstone)‏ يطور الأسس الرياضية للتحليل العاملي factor analysis‏ 
.(Nunnally, 1978)‏ وقد امتدت اهتمامات ”ثورستون“ لكل من القدرات العقلية وعلم 
)1( مجموعة الأعداد الصبيعية E‏ من all‏ إلى موص ا dely OU EO‏ سيد Nach degaze Ll dye JSG‏ 
الصحيحةء فتشتمل على الأعداد من سالب ما لا نهاية بالإضافة إلى الصفر بالإضافة إلى الأعداد ا موجبة التي تحتويها 
مجموعة الأعداد الطبيعية بزيادة واحد صحيح كل مرة. Lal‏ الأعداد الكسريةء فتتكون من كسور الأعداد الصحيحة في 
صورة بسط ومقام. أما الأعداد الحقيقية» فتشمل المجموعات السابقة كلها بالإضافة إلى الأعداد التي لا يمكن كتابتها 
على شكل كسور مثل باي )0( أي الأعداد اللاكسرية. ويمكن تصور الأعداد الحقيقية بأنها أعداد غير متناهية على 
خط مستقيم. وتأخذ الأعداد الحقيقية اسمها من تضادها مع فكرة الأعداد التخيلية. كما يمكن لها أن تقوم بقياس 
الكميات المستمرة على اختلافها (المترجمّين). 
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النفس الفسيولوجي. ووفقاً لدانكان )1984 (Duncan,‏ فإن ”ستيفنز“ قد نسب إلى 
”ثورستون“ تطبيق الطرق والأساليب السيكولوجية في قياس المحفزات الاجتماعية. وهكذاء 
فإن dlas‏ هثل تقارباً بين الجذور التاريخية المنفصلة. 


التطورات اللاحقة فى القياس: 


تطور المفاهيم الأساسية: 

وبقدر ما كان «ستيفنز» Miho‏ فإن تصوره للقياس ليس هو الكلمة النهائية بأي حال 
من الأحوال. فقد عرف القياس بأنه «تخصيص وتعيين الأرقام للأشياء أو الأحداث وفقًا 
للقواعد» )1984 (Duncan,‏ وقد اعترض ”دانكان“ على هذا التعريف باعتباره غير مكتمل 
بنفس الطريقة التي يكون بها «تشغيل البيانو عن طريق ضرب مفاتيح الآلة وفقًا لبعض 
الأماط» غير مكتمل. فالقياس ليس فقط تعيين الأرقام ...إلخ» بل هو أيضاً تعيين الأرقام 
بطريقة تتوافق مع درجات مختلفة من النوعية ... أو خاصية شيء أو حدث ما (ص (YT‏ 

وقد حددت «نارينس ولوسي» )1986 Sg Ló (Narens and Luce,‏ على تصور 
”ستيفنز“ الأصلي للقياس وأوضحا عددًا من التحسينات اللاحقة. ومع US‏ يؤكد عملهم 
على نقطة أساسية أثارها ”ستيفنز“ وهي: أنه توجد نماذج للقياس بخلاف النوع الذي 
أقرته اللجنة (الجمعية البريطانية لتقدم العلوم)» وتؤدي هذه النماذج إلى طرق قياس قابلة 
للتطبيق على العلوم غير الطبيعية وكذلك على العلوم الطبيعية. والخلاصة» إن هذا العمل 
المتعلق بالخصائص الأساسية للمقاييس قد أرسى الشرعية العلمية لأنواع وأنماط إجراءات 
القياس المستخدمة في العلوم الاجتماعية. 


تطور الاختبارات العقلية: 


على الرغم من أن الاختبارات العقلية gl)‏ اختبار القدرات» كما هو معروف الآن وأكثر 
(Eqns‏ كانت مجالًا تقليدياً نشطًا في القياس النفسيء إلا أنها لا تمثل محورًا أساسيًا لهذا الكتاب. 
ومع US‏ فإنه تجدر الإشارة إليها كمصدر للمساهمات الهامة في نظرية القياس وأساليبه. 
وقد نُشر لأول مرة في عام VITA‏ منشور تاريخي حول النظريات الإحصائية لدرجات الاختبارات 
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العقلية. el‏ بإعداده «فريدريك م. لورد« وميلفين ر. نوفيك» Frederic M. Lord and‏ 
Melvin R. Novick‏ وأعيد إصداره مؤخرًا )2008 «(Lord & Novick,‏ وقد نشا وتطور 
هذا العمل من الأنشطة الفكرية الثرية لمجموعة الأبحاث السيكومترية الخاصة بخدمة 
الاختبارات التعليمية» والتي قام بها ”لورد ونوفيك“. ويلخص هذا النص امثير للإعجاب 
الكثير مما كان معروفًا في مجال اختبار القدرات في ذلك الوقت وكان من بين أول الأوصاف 
المقنعة ما أصبح يعرف باسم نظرية استجابة البند .(item response theory)‏ وقد كان 
المدخل الأخير مناسبًا بشكل خاص بلجال أوسع نطاقاً مثل الاختبارات العقلية. والعديد 
من أوجه التقدم في هذا الفرع من القياس النفسي أقل شيوعًاء وربما تكون أقل سهولة 
في التطبيقء Lewis‏ يكون الهدف هو قياس الخصائص الأخرى بخلاف القدرات العقلية. 
ومع مرور الوقت» أصبحت إمكانية تطبيق هذه الطرق على سياقات القياس بخلاف تقييم 
القدرات أكثر وضوحًاء وسنناقشها في فصل لاحق. ومع US‏ سأركز في المقام الأول على 
الأساليب ”الكلاسيكية أو التقليدية“ التي سيطرت إلى حد كبير على قياس الظواهر الاجتماعية 
والنفسية غير القدرات. وهذه الطرق هي بصفة عامة أكثر مرونة وسلاسة بالنسبة لغير 
ا متخصصين ويمكن أن تسفر عن نتائج ممتازة. 


تقييم المرض العقلي: 

كان لتطور أوصاف الأمراض العقلية تاريخ منفصل يقدم دراسة حاله مفيدة في كيفية أن 
عدم وجود نموذج قياس إرشادي هكن أن يجعل التقييم عمليه معقدة. وعلى مر القرونء 
تطورت قدرة المجتمع على التعرف على أنواع مختلفة من الأمراض العقلية عن طريق 
الملاحظة غير المقننة تماماً نحو الجهود المبذولة لفهم العلاقات بين الأعراضء والأسبابء 
والعلاجات المتوافقة مع القياسات الأكثر رسميه. لقد كانت رحله صعبة. 


كانت الكتابات الرومانية واليونانية والمصرية المبكرة تساوي بين ما ندركه ونعرفه على أنه 
أعراض للمرض العقلي مع استحواذ الجن والشياطين أو غيرها من الظروف الخارقة للطبيعة 
«قوى فوق الطبيعة» le)‏ سبيل .(PBS, 2002 JELI‏ وبحلول عام 2٠١‏ قبل اطيلاد. كان 
الطبيب اليوناني أبقراط (Hippocrates)‏ يحاول فهم الظروف العقلية على أنها ناشئة عن 
العمليات الفسيولوجية التي كانت محور التركيز الرئيسي في عمله العلمي )2002 (PBS,‏ 
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وربما كانت جهوده من أوائل الجهود التي بذلها في التفكير في المؤشرات dow pall‏ للمرض 
العقلي من حيث أسبابه الكامنة. ومع WS‏ حتى في تلك المرحلة وما بعدهاء تم وصف 
الأمراض العقلية فينومينولوجيا" (بشكل ظاهري)؛ أي إن المظاهر المرتبطة بالمرض العقلي 
كانت مجرد بيانات وصفية Vay‏ من فهمها كنقاط نهاية في تسلسل له سبب أساسي واضح 
واحد أو أكثر من الأسباب الكامنة. 
وقد استمرت أساليب التصنيف البسيط للمرض العقلي لأكثر من ألف عام تقريباً. وقد 
لخص «تارتاكوفسكي» )2011 (Tartakovsky,‏ كيف تم تصنيف المرض العقلي لأغراض 
التعداد في الولايات المتحدة في وقت مبكر من منتصف القرن التاسع عشر. وفي تعداد عام 
٠‏ كانت هناك فئة واحدة فقط هي ”البلاهة / الجنون“ تشير إلى وجود مشكلة عقلية. 
وبحلول عام AM‏ توسع نظام تصنيف التعداد السكاني ليشمل الفئات التالية للمرض 
العقلي: الهوس. والكآبةء والهوس الأحاديء والشلل الجزثيء والخرف. والهذيان» والصرع. 
وهذه هي الأوصاف الأساسية لحالات أو سلوكيات غير طبيعية (مثل الحزن ا مستمر أو الإفراط 
في شرب الخمر أو ضعف العضلات أو التشنجات) بدلاً من التصنيفات المسببة للأمراض. 


وفي وقت مبكر من ثمانينيات القرن التاسع عشرء بدأ الطبيب النفسي الأماني ”إميل 
کریبیلین“ (Emil Kraepelin)‏ في التمييز بشكل أكثر منهجية بين الاضطرابات العقلية. وقد 
كان ” کریبیلین“ تلميذاً لعام النفس الأماني ”فيلهلم (Wilhelm Wundt) “Suis‏ - والذي 
يعتبر مؤسس ole‏ النفس التجريبي - وكان ”كريبيلين“ Lub‏ أيضاً )1968 (Eysenck,‏ 
ومن ثم قدم منظورين مختلفين لتصنيفاته للأمراض العقلية. وق AMY els‏ نشر SLS‏ 
باللغة الأمانية تحت عنوان (Kraepelin, 1883) (Compendium der Psychiatric)‏ 
وهو كتاب أساسي يدعو إلى تصنيف علمي بصورة أكثر للأمراض النفسية والتمييز بين 
(Y)‏ الفينومولجي (Phenomenology)‏ الظاهراتية هي العلم الذي يدرس الظواهرء والمقصود من الظواهر هنا ليست 
ظواهر العالم الخارجيء أي الظواهر الطبيعية الفيزيائيةء بل امقصود بالظواهر ظواهر الوعي» أي ظهور موضوعات 
وأشياء العام الخارجي في الوعيء وبذلك تكون الفينومينولوجيا هي دراسة الوعي بالظواه ر وطريقة إدراكه لها 
وكيفية حضور الظواهر في خبرته. فالفينومينولوجيا ليست le daigo‏ يصاحب عملية ا لمعرفة من حالات ذهنية 
أو وظائف عضوية ترجع إلى الجهاز العصبي» بل بكيفية إدراك الوعي للموضوع ووصوله إلى معرفة موضوعية 
ويقينية حوله؛ أي بالاستعدادات المعرفية الموجودة لدى الذات الإنسانية والتي تمكنها من تأسيس معرفة يقينية, 
وهذه الاستعدادات ليست سيكولوجية» بل مرتبطة بالوعي الخالص قبل أن يتصل gb‏ خبرة تجريبية (المترجمّين). 
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الخرف بريكوكس ld)‏ الجنون) والذهان الهوسى الاكتئابي. لكن مرة أخرىء على الرغم من 
جهوده لاستدعاء تفسيرات لهذه الأمراض» فإن فئات التشخيص اللمبكرة الخاصة به هي في 
امقام الأول وصفًا موجرًا لأعراض واضحة تميل إلى الحدوث dee‏ وليست التفسيرات المسببة 
المقنعة )2007 (Decker,‏ على الرغم من أن ”كريبلين“ قد طور النهج العلمي لفهم المرض 
العقليء إلا أن الأدوات المتاحة له كانت بدائية» وف Aly‏ كانت فئاته لتشخيص الأمراض 
لا تزال وصفية إلى حد كبير. 

ويّقِيّم ”ديكر“ )2007 (Decker,‏ إرث ”كريبيلين“ على النحو التالي: ”وخلاصه القول: 
وفقاً لمعايير البحث الحالية» فإن الأعمال العلمية ل ”كريبيلن“ واستدلالاته من شأنها أن 
تثير تساؤلات حول الأفكار والمفاهيم المسبقة وتحيز الملاحظين. ويمكن رؤية أوجه القصور 
العلمية في وصف ”كريبيلين“ نفسه لأساليبه ومنهجه. وعلى الرغم من تألقه في التصنيفات 


الفئوية الواضحة» فإن تراثه العلمي قام على أسس تجريبية هشة وضعيفة“ (ص (VEN‏ 


في منتصف القرن العشرينء حاول الطب النفسي الأمريكي فرض المزيد من النظام على 
تقيبم المرض العقلي. وبحلول موعد ظهور الدليل التشخيصي والإحصائي للاضطرابات 
العقلية DSM)‏ الرابطة الأمريكية للطب النفسي APA‏ 1107). حاولت نظم التصنيف 
السائدة تصنيف الأمراض العقلية على أساس كل من مظاهرها ومسبباتها على حد سواء 
كما هو الحال بالنسبة للصدمات الدماغية الحادة أو إدمان الكحول. ومع ذلكء م يتم بعد 
تطوير مفاهيم أكثر دقة لمسببات الظروف غير المرتبطة بسبب خارجي واضح. وغالباً ما كان 
يفترض أسباب نفسية ديناميكية. وكان ا مصطلح المطبق على مثل هذه الحالات والظروف 
هو ردود الفعل» التي يُفترض أنها ضغوط نفسية GIS‏ أصول غير محددة. ومره أخرى 
كانت التصنيفات في المقام الأول أوصافاً لأعراض ظاهرة. وعلى الرغم من أن نظام تصنيف 
الدليل التشخيصي والإحصاني للاضطرابات العقلية (DSM)‏ هثل تقدماً واضحاً يتجاوز النظم 
السابقة. إلا أنه لا يزال غير مطابق معايير القياس الحديثة. حتى بعد أربعه عقود dic‏ ذلك 
الوقتء عندما ظهر الإصدار الرابع من الدليل التشخيصي والإحصائي للاضطرابات العقلية 
DSM-IV‏ (الجمعية الأمريكية للطب النفسيء + (s+‏ كان هناك قدر كبير من عدم الرضا 
عن نظام التصنيف. وقد لاحظ عام النفس ”بول (Paul Meehl, 1999) “Jase‏ أن المشكلة 
ليست بالضرورة في استخدام الفئات (بعضها صعب وسريع» أو تنتمي أو لا تنتمي» رها 


yy‏ تطوير المقايبس: النظرية والتطبيق 


dole نظرة‎ 


كانت هناك LS LS‏ قال) ولكن عدم وجود مبرر منطقي واضح Gust‏ الناس لهذه 
الففات. وعلى حد تعبير ”ميهل“ )1999( ”بالنسبة لتلك الأقلية من قواعد الدليل 
التشخيصي والإحصائي للاضطرابات العقلية التي تشير إلى الكيانات التصنيفيةالحقيقية, فإن 
إجراءات تحديدها ومعايير تطبيقها تفتقر إلى أساس علمي كاف“ (ص (OTT‏ 

لقد أتاحت مقدمة الإصدار الخامس من الدليل التشخيصي والإحصائي للاضطرابات 
العقلية (DSM-V)‏ وظهوره في نهاية المطاف في ۲١٠١‏ (الجمعية الأمريكية للطب 
النفسيء (VV‏ الفرصة لإعادة النظر في تصنيف الصحة العقلية. ويري البعض أن الفريق 
الذي عمل على التنقيح والمراجعة للدليل م يستفد استفادة كاملة من تلك الفرصة التي 
أتيحت له. وكما لوحظء فإن إحدى سمات تصنيف الصحة العقلية تاريخياً هي أنها سعت 
إلى التصنيف بدلاً من القياس. أي إن الهدف كان وصف الوجود أو الغياب Vos‏ من تحديد 
درجة حالة محددة. وتشير التجربة إلى أنه حتى في الحالات» مثل الفصام» فإن ”ميهل“ 
)1994( كان على استعداد للاعتراف بالتصنيف (أي أن تكون اضطرابات منفصلة سواء 
كانت موجودة أو غائبة). فهناك سلسله متصلة من الضعف بدلاً من حالة الكل أو لا شيء. 
ومع ذلك لا يزال الاعتماد على التصنيف بدلاً من القياس LEB‏ 

في العديد من الحالات» كانت تنطوي على حدود تعسفية للعلامات والأعراضء مثل 
اجتياز خط وهمي من الشدة يشكل وجود حالة في حين أن عدم اجتياز هذا الخط الوهمي 
يعبر عن عدم وجود الحالة. Las)‏ فقد استندت التصنيفات بشكل حصري تقريبًا إلى 
ملاحظات حول الأعراض الظاهرة بدلاً من تقييمات الدلالات الرئيسية للحالات» مثل وجود 
الأسباب المرضية السببية أو علامة وراثية أو حالة غير طبيعية من الكيمياء الداخلية التي قد 
تكون أساسًا لتعيين التشخيص الجسدي. عندما بدأ العمل (خارج الرؤية العامة) على الدليل 
التشخيصي والإحصائي للاضطرابات العقلية الإصدار الخامس DSM-V‏ أعرب الكثيرون عن 
أملهم في أن تكون المراجعة والتنقيح JS)‏ جرأة من الإصدارات السابقة وأن يتم تطبيق 
أساليب تقييم أكثر حداثة. وفي عام 7٠٠0‏ بعد الإعلان عن خطط مراجعة وتنقيح الدليل 
التشخيصي والإحصائي للاضطرابات العقلية Gilly)‏ ستصبح الإصدار الخامس من الدليل 
(DSM-V‏ بدأ ا مجتمع العلمي للصحة النفسية في التعبير عن مخاوفه. على سبيل JELI‏ 
ركز ous‏ خاص من مجلة ele‏ النفس المرضي (Journal of Abnormal Psychology)‏ 
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على أهمية وجدوى إعادة التفكير في als‏ الأمراض النفسية استناداً إلى تحديد الأبعاد 
الأساسية» مثل الفكر المضط رب Sly‏ والسلوكء التي تؤدي إلى مشاكل محددة في 
الصحة العقلية )2005 .(Kreuger, Watson, & Barlow,‏ وقد جادل كروجر وآخرون 
(Kreuger et al., 2005)‏ بأن هذ المدخل أو امنهج يمكن أن يعالج اثنين من أوجه 
القصور التجريبية الأساسية لنظم التصنيف القائمة على الفئة هما: انتشار واسع للإصابة 
ا مرضية المشتركة (أي مجموعات الأعراض الفردية التي تناسب التشخيصات المتعددة) 
وعدم التجانس الشديد داخل التشخيص gl)‏ الأفراد الذين تم تحديد نفس التشخيص لهم 
يتشاركون في الأعراض بصورة قليلة أو ربما لا توجد أعراض). ولقد ضغط كل من الباحثين 
والمنظرين وحتى الفلاسفة (على سبيل JEL‏ أراغونا )9+ Aragona (Y+‏ ) من أجل إعادة 
النظر في تشخيص المرض العقلي الذي كان أكثر انسجاماً مع العمل التجريبي مثل أساليب 
ومداخل القياس الحديثة. ومع WS‏ وعلى الرغم من هذه الجهود. فقد أصدرت الجمعية 
الأمريكية للأمراض النفسية الإصدار الخامس من الدليل التشخيصي والإحصائي للاضطرابات 
العقلية DSM-V‏ في شكل احتفظ lay‏ التصنيف الأساسي المستخدم في الإصدارات 
السابقة. وقد دفع ذلك ”توماس إنسل“ (Thomas Insel)‏ مدير المعهد الوطني للصحة 
العقلية (NIMH)‏ إلى إصدار بيان على مدونته )2013 (Insel,‏ يقول: إن المعهد الوطني 
للصحة العقلية م يعد ينظم جهوده البحثية حول فئات الدليل التشخيصي والإحصائي 
للاضطرابات العقلية وأنه بذل جهداً لمدة pic‏ سنوات» وهو مشروع معايير مجال البحث 
Ws (RDOC)‏ لإعادة صياغة مفهوم ووضع تصور للأمراض العقلية. وقد وصف إنسل 
(Insel, 2013)‏ هذا الجهد بالقول: إن مشروع معايير مجال البحث “RDoC”‏ هو إطار 
لجمع البيانات اللازمة لعلم تصنيف وتشخيص الأمراض الجديد. ولكن من المهم أن ندرك 
أننا لا نستطيع النجاح إذا استخدمنا فئات الدليل التشخيصي والإحصائي للاضطرابات العقلية 
على أساس أنه ”المعيار الذهبي“. وف الشهر Stl‏ أصدر ”إنسل“ بيانًا صحفيًا مشترگا مع 
الرئيس المنتخب للجمعية الأمريكية للطب النفسي آنذاك ”جيفري أ. Jeffrey A. “Glos‏ 
Lieberman‏ في هذا الإصدارء ذكروا ما يلي: 


اليوم» هثل الدليل التشخيصي والإحصائي للاضطرابات العقلية (DSM)‏ 
التابع للجمعية الأمريكية للطب النفسي (APA)‏ إلى جانب التصنيف 
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الدولي للأمراض (ICD)‏ أفضل المعلومات المتاحة le‏ للتشخيص السريري 
للاضطرابات العقلية. 

ومع US‏ فإن ما قد يكون ممكناً من الناحية الواقعية في الوقت الحاضر 
بالنسبة للممارسين م يعد كافياً للباحثين. واستشرافاً للمستقبلء OB‏ وضع 
الأساس لنظام تشخيصي مستقبلي يعكس ogas‏ مباشره علوم المخ الحديثة, 
سيتطلب الانفتاح لإعادة التفكير في الفئات التقليدية. ومن الواضح بشكل متزايد 
أن المرض العقلي سيتم فهمه على أفضل وجه على أنه اضطرابات في بنية الدماغ 
ووظيفته التي تنطوي على مجالات محددة من الإدراك والعاطفة والسلوك. 
هذا هو التركيز الخاص أو محور مشروع ples‏ مجال البحث (RDOC)‏ الخاص 
بالمعهد الوطني للصحة العقلية „(Insel & Lieberman, 2013) .NIMH‏ 


في أكتوبر 10+ استقال ”إنسل“ من منصبه في المعهد الوطني doua‏ العقلية (إنسلء 
(Y+ V0 Insel‏ لقبوله منصب في قسم علوم الحياة في شركة ألفا بيت (Alphabet)‏ والشركة 
هي امظلة التي تشكلت كجزء من إعادة التنظيم الهيكلي لجوجل Google‏ وكان من 
بين العوامل التي ذكرها ”إنسل“ أنها أثرت على قراره هو أمله في التوصل إلى منهج أكثر 
تنظيماً لتصنيف الصحة العقلية. كما ذكر في مقابلة ilab‏ إم.آي.تي ممراجعة التكنولوجيا 
(MIT Technology Review)‏ أن انتقاله إلى شركة WI‏ بيت“ في جزء die‏ هثل ”محاولة 
لاكتشاف طريقه أفضل لجلب تحليلات البيانات إلى الطب النفسي. فنظام التشخيص الذي 
نملكه يستند WS‏ على الأعراض القائمة وذات طابع شخصي إلى حد ما“ )2015 (Regalado,‏ 
ويأمل الكثيرون في أن العمل الذي يقوم به ”إنسل“ في شركة ”ألفا بيت“ سوف يعزز 
تحديث التقييم النفسي لجعله أكثر توافقاً مع معايير القياس الحديثة. 

يذكر دنكان )1984 (Duncan,‏ أن تأثير القياس النفسي في العلوم الاجتماعية قد 
تجاوز أصوله في قياس الأحاسيس والقدرات الفكرية. ومن الواضح أن القياس النفسي ظهر 


كنموذج منهجي أو ميثودولوجي في حد ذاته. ويدعم ”دنكان“ هذه الحجة بثلاثة أمثلة 
لتأثير القياسات النفسية: )١(‏ الاستخدام واسع الانتشار للتعاريف السيكومترية للثبات 
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والصدق» (Y)‏ انتشار استخدام التحليل العاملي في أبحاث العلوم الاجتماعية» (V)9‏ تبني 
أساليب القياس النفسي من أجل تطوير المقايبس التي تقيس مجموعة من المتغيرات أوسع 
بكثير من تلك التي كانت لا تهتم بها القياسات النفسية في البداية (ص (YY‏ إن ALB‏ 
تطبيق المفاهيم والأساليب السيكومترية لقياس الظواهر النفسية والاجتماعية المتنوعة 
ستستحوذ على اهتمامنا فيما تبقى من هذا الكتاب. 


دور القياس في العلوم الاجتماعية: 


علاقة النظرية بالقياس: 

الظواهر التي نحاول قياسها في أبحاث العلوم الاجتماعية غالباً ما تنبع من النظرية. 
وبالتالي» تلعب النظرية دورًا رئيسيًا في كيفية تصورنا USLEL‏ القياس الخاصة بنا. في الواقع, 
يذكر لورد ونوفيك )2008 (Lord and Novick,‏ أن للقضايا النظرية دوراً مهماً في تطوير 
نظرية القياس. وكان المنظرون يشعرون بالقلق من أن تقديرات العلاقات بين المفاهيم 
البنائية constructs‏ محلاً للاهتمام» قد تم الحصول عليها عمومًا من خلال المؤشرات 
المرتبطة بتلك ا مفاهيم البنائية. ونظراً OV‏ تلك المؤشرات تحتوي على dhs‏ فإن الارتباطات 
الناتجة عن ذلك كانت أقل من العلاقة الفعلية بين المفاهيم البنائية» وقد حفز ذلك على 
تطوير واستحداث أساليب لتعديل وتصحيح الارتباطات من أجل تقليل الخطأ وحفز تطوير 
نظرية القياس كمجال اهتمام وتركيز متميز (ص (V9‏ 

بطبيعة Sled!‏ فإن العديد من مجالات العلوم تقيس الأشياء المشتقة أو المستمدة من 
النظرية. وحتى يتم تأكيد العناصر الفرعية من خلال القياس» فهي Las]‏ مجرد مفاهيم بنائية 
نظرية. ومع HS‏ تختلف النظرية في علم النفس والعلوم الاجتماعية الأخرى عن dy Bul‏ 
في العلوم الطبيعية. وهيل العلماء في العلوم الاجتماعية إلى الاعتماد على العديد من النماذج 
النظرية التي تتعلق أو تهتم بالظواهر الضيقة النطاق والمحددة إلى حد ماء في حين أن 
النظريات في العلوم الطبيعية أقل من حيث العدد وأكثر شمولًا من حيث النطاق أو ا مجال. 
على سبيل lib!‏ تركز نظرية المقارنة الاجتماعية لفستنجر )1954 (Festinger,‏ على مجموعة 
ضيقة إلى حد ما من الخبرة الإنسانية: الطريقة التي يُقَيّم بها الناس قدراتهم أو آراءهم من 
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خلال مقارنة أنفسهم مع الآخرين. eg‏ النقيض من EUS‏ يواصل علماء الفيزياء العمل 
نحو إيجاد نظرية موحدة كبيرة النطاق تضم جميع القوى الأساسية للطبيعة ضمن إطار 
مفاهيمي واحد. daj‏ العلوم الاجتماعية أقل نضجاً من العلوم الطبيعيةء ونظرياتها التي 
تتطور بسرعة أكبر. ويشكل قياس الظواهر المعقدة وغير ا لملموسة المستمدة من نظريات 
متعددة ومتطورةء تحديًا واضحًا للباحثين في العلوم الاجتماعية. UUs‏ من المهم بصفة 
خاصة أن نضع في اعتبارنا إجراءات القياس وأن ندرك تماماً نقاط قوتها وأوجه القصور فيها. 

وكلما ازدادت معارف الباحثين عن الظواهر التي يهتمون بدراستهاء والعلاقات التجريدية 
ا موجودة بين المفاهيم البنائية الافتراضية» والأدوات الكمية المتاحة لهم» كانوا أكثر جاهزية 
بشكل أفضل لتطوير مقاييس تتميز بالثبات والصدق والقابلية للاستخدام والتطبيق. ولعل 
المعرفة التفصيلية بظاهرة محددة موضع الاهتمام تعد أهم هذه الاعتبارات. على سبيل 
SLL!‏ نظرية المقارنة الاجتماعية لها العديد من الجوانب التي قد تنطوي على إستراتيجيات 
قياس مختلفة. وقد يتطلب أحد الأسئلة البحثية تفعيل المقارنات الاجتماعية باعتبارها 
تفضيلاً نسبياً للمعلومات المتعلقة بالآخرين ذوي المكانة الأعلى أو GM‏ في حين قد يفرض 
سؤال بحثي آخر تصنيف الذات بالنسبة إلى ”الشخص العادي“ على مختلف الأبعاد. وقد 
لا تسفر المقاييس المختلفة التي تقيس جوانب مختلفة من نفس الظاهرة العامة (مثل 
ا مقارنة الاجتماعية) عن نتائج متقاربة (ديفيليس. 1990 .(DeVellis et al.,‏ وق الحقيقة, 
تقوم المقايبس بتقييم متغيرات مختلفة على الرغم من استخدام اسم متغير مشترك أو عام 
في توصيفها. Why‏ فإن وضع وتطوير مقياس مناسب على النحو الأمثل لسؤال البحث 
يتطلب فهم التفاصيل الدقيقة للنظرية. 

تتطلب المتغيرات ال مختلفة إستراتيجيات تقييم مختلفة. على سبيل JGL‏ مكن 
ملاحظة ous‏ العملات المميزة المأخوذة مباشرة من صندوق أو حاويةء في Yo‏ أنه لا هكن 
ملاحظة الكثير من المتغيرات التي يهتم بها العلماء الاجتماعيون والسلوكيون بشكل مباشر؛ 
فا معتقدات. والحالات التحفيزية. والتوقعات, والاحتياجات» والعواطف. وتصورات الدور 
الاجتماعي ليست سوى أمثلة قليلة. لا هكن ملاحظة بعض المتغيرات مباشرة ولكن هكن 
تحديدها بإجراءات بحثية غير الاستبيانات. على سبيل JGL‏ على الرغم من أنه لا مكن 
للباحثين المعرفيين أن يلاحظوا بشكل مباشر كيفية تنظيم الأفراد للمعلومات حول النوع 
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الاجتماعي في مخططاتهم الذاتيةء إلا أنهم قد يكونون قادرين على استخدام إجراءات 
التذكر للاستدلال على كيفية تنظيم الأفراد لأفكارهم حول الذات والجنس. ومع EUS‏ هناك 
العديد من الحالات التي يستحيل فيها أو لا يكون عملياً تقييم متغيرات العلوم الاجتماعية 
بأي طريقة أخرى غير استخدام مقياس القياس الورقي والقلم الرصاص. هذا هو الحال في 
كثير من الأحيان» ولكن ليس Glo‏ عندما يكون الاهتمام منصباً على قياس المفاهيم البنائية. 
وهكذاء فإن الباحث ال مهتم بقياس ظاهرة أنثوية المظهر androgyny‏ قد يجد أنه من 
الأمهل بكثير القيام بذلك عن طريق استبانة تم تطويرها بعناية من خلال إجراءات بديلة. 


المقاييس النظرية وغير النظرية: 

في هذه dle jbl‏ ينبغي أن نعترف Gb‏ على الرغم من أن هذا الكتاب يركز على مقاييس 
المفاهيم ASL!‏ فليس من الضروري أن تكون كل التقييمات باستخدام الورقة والقلم 
الرصاص في dele‏ إلى نظرية. فالجنس والسنء على سبيل JELI‏ يممكن التحقق منهما 
من التقرير GUI‏ عن طريق استبانة. Flag‏ على سؤال البحث» يمكن أن يكون هذان 
Ola sib‏ من مكونات نموذج نظري أو ببساطة جزءاً من وصف المشاركين في الدراسة. 
لا يوجد أساس نظري لبعض السياقات التي يُطلب فيها من الأشخاص الإجابة على قائمة من 
الأمئلة باستخدام نسق أو شكل ورقي وقلم رصاصء مثل تقييم تفضيلات وجبة ا مريض 
في المستشفى. وفي حالات أخرىء قد تبدأ الدراسة غير نظرية ولكنها تؤدي إلى صياغة 
النظرية. على سبيل JEL‏ قد يطلب باحث في مجال التسوق من الآباء سرد أنواع الألعاب 
التي اشتروها لأطفالهم. بعد WS‏ قد يستكشف الباحث من هذه القوائم LU‏ العلاقات. 
وبناءً على الأماط الملاحظة لعمليات شراء الألعاب» هكن للباحث تطوير نموذج لسلوك 
الشراء. وتمثل استبانات الرأي العام مثالاً آخر على القياس اللانظري إلى حد ما. إن سؤال 
الناس عن العلامة التجارية للصابون الذي يستخدمونه أو Ob‏ يعتزمون التصويت لصالحهم 
في الانتخابات نادراً ما ينطوي على أي محاولة للاستفادة من مفهوم بنائي نظري أساسي. 
Vag‏ من ذلك فإن الاهتمام يكمن في الاستجابة الموضوعية في حد ذاتهاء وليس في بعض 
خصائص الشخص التي يفترض أن يعبر عنها. 


YA‏ تطوير المقاييس: النظرية والتطبيق 


dole نظرة‎ 


قد يكون التمييز بين مواقف القياس النظرية وغير النظرية Gao fal‏ في بعض الأحيان. 
على سبيل JEA‏ فإن البحث عن تفضيل الناخب ف المرشحين للرئاسة كوسيلة للتنبؤ بنتيجة 
الانتخابات يعني مطالبة المجيب أو المجيبة بالإبلاغ عن نيته أو نيتها السلوكية. قد يسأل 
الباحث الناس عن LAS‏ تخطيطهم للتصويت في LEG‏ ليس بدافع الاهتمام بعمليات 
صنع القرار الانتخابي بل لمجرد توقع نتائج الانتخابات النهائية. ومن ناحية أخرىء إذا طرح 
السؤال نفسه في سياق دراسة حول LAS‏ تأثير الاتجاهات أو المواقف نحو LLAS‏ محددة على 
تفضيل المرشحين» OB‏ وجود نظرية مفصلة بشكل جيد قد تكون أساساً للبحث. ولا تهدف 
المعلومات المتعلقة بالتصويت في هذه الحالة إلى الكشف عن الكيفية التي سوف يصوت 
بها المستجيبونء ولكن لتسليط الضوء على الخصائص الفردية. في هاتين الحالتين» فإن صلة 
أو عدم صلة المقياس بالنظرية تعد مسألة تتعلق بنية وهدف الباحث» وليست بالإجراءات 
ا مستخدمة. وتتم إحالة القراء ا مهتمين بمعرفة المزيد حول بناء استبانات المسح التي ليست 
معنية في المقام الأول بقياس المفاهيم البنائية الافتراضية إلى ال مراجع التالية: كونفيرس» 
وبيريسر )1986( ‘Converse and Presser‏ كزاجا وبلير )1996( ‘Czaja and Blair‏ 
ديلمان )2007( ‘Dillman‏ فينك )1995( ‘Fink‏ فاولر )2006( ‘Fowler‏ وفيسبرج› 
وكروسنيك. وبراون )1996( Weisberg, Krosnick, and Bowen‏ . 


أنواع المقاييس: 

غالباً ما يشار إلى أدوات القياس التي تتكون من مجموعات من الفقرات» والتي 
يتم تجميعها معاً في درجه مركبة بهدف الكشف عن مستويات المتغيرات النظرية التي 
لا يمكن ملاحظتها بسهوله بالوسائل المباشرة. على il‏ مقاييس. ونحن نطور مقاييس 
عندما نريد قياس الظواهر التي نعتقد أنها موجودة بسبب فهمنا النظري hlel‏ ولكننا 
Y‏ نستطيع أن نقيمها بصورة مباشرة. على سبيل المثال» قد نقوم باستحضار الاكتئاب 
أو القلق كتفسيرات للسلوكيات التي نلاحظها. ويتفق معظم op fait!‏ على أن الاكتئاب 
أو القلق لا يعادل السلوك الذي نراه ولكنه يكمن وراءه. وتفترض نظرياتنا أن هذه 
الظواهر موجودة وأنها تؤثر على السلوك ولكنها غير ملموسة. وفي بعض GLE!‏ قد يكون 
من المناسب استنتاج وجودها من عواقبها السلوكية. ومع ELIS‏ في بعض الأحيان» قد 
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لا نتمكن من الوصول إلى المعلومات السلوكية (كما هو الحال عندما نقتصر على استخدام 
منهجيات ال مسح البريدي». أو قد لا نكون متأكدين من LAS‏ تفسير عينات أو نماذج 
السلوك المتاحة (كما هو الحال عندما يظل الشخص سلبياً في مواجهة حدث قد يتفاعل 
معه معظم الأشخاص الآخرين بقوة). أو قد لا يرغب ف افتراض أن السلوك غير متماثل مع 
المفهوم البنائي الأساسي محل الاهتمام LS)‏ هو الحال عندما نشك في أن البكاء هو نتيجة 
الفرح وليس الحزن). وفي الحالات التي لا نستطيع فيها الاعتماد على السلوك كمؤشر على 
وجود ظاهرة cle‏ قد يكون من المفيد تقييم ا مفهوم البنائي من خلال مقياس تم بناؤه بعناية 
والتحقق من صدقه. 

وحتى بين المتغيرات المشتقة من dy BI)‏ هناك سلسلة متصلة ضمنية تتراوح من 
ظواهر ملموسة نسبياً هكن الوصول إليها إلى الظواهر المجردة نسبياً والتي يتعذر الوصول 
إليها. ولن يتطلب كل شيء مقاييس متعددة البنود أو الفقرات. ومن المؤكد أن العمر 
والجنس لهما صلة بالعديد من النظريات ولكن نادراً ما يتطلبان مقياسًا متعدد البنود لإجراء 
تقييم دقيق. يعرف الناس سنهم وجنسهم. وترتبط هذه المتغيرات» في معظم الأحوالء 
بخصائص ملموسة لا لبس فيها نسبياً (مثل التشريح) أو الأحداث (مثل تاريخ الميلاد). وما 
مم تكن هناك ظروف dole‏ مثل ضعف الجهاز العصبيء يمكن للمستجيبين استرجاع Siig‏ 
المعلومات المتعلقة بأعمارهم وجنسهم من الذاكرة بسهولة تامة. ويمكنهم الاستجابة 
بدرجة عالية من الدقة على سؤال واحد لتقييم متغيرات مثل هذه. ويمكن القول إن الأصل 
العرقي أكثر تعقيدًا وتجريدًا من العمر أو الجنس» وعادةً ما ينطوي على مزيج من العوامل 
المادية والثقافية والتاريخية. ونتيجة UL‏ فإن eg gab!‏ البنائي الاجتماعي أقل في درجة 
الملموسية - من العمر أو الجنس. وعلى الرغم من أن الآليات التي ينطوي عليها تحديد 
الشخص الأصل العرقي قد تكون معقدة وتتكشف على مدى فترة زمنية طويلةء OB‏ معظم 
الأفراد توصلوا إلى تعريف شخصي وهكنهم الإبلاغ عن أصلهم العرقي بقليل من التفكير أو 
التأمل. وبالتالي» قد يكفي متغير واحد لتقييم الأصل العرقي في معظم الظروف والحالات 
(غير أن هذا قد يتغير لأن مجتمعنا يصبح تدريجياً أكثر تعدداً في العرقيات ولأن الأفراد 
يعرفون انتماءهم العرقي الشخصي من حيث المجموعات الاثنية المتعددة التي تعكس 
أسلافهم). ومع GIS ELIS‏ العديد من المتغيرات النظرية الأخرى تتطلب من ا مستجيب 
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dale}‏ بناء المعلومات القليلة المتاحة أو تفسيرها أو الحكم عليها أو مقارنتها أو تقييمها. 
على سبيل المثال» قياس كيف يعتقد الأشخاص المتزوجون أن حياتهم ستكون مختلفة إذا 
اختاروا زوجاً مختلفاً على الأرجح يتطلب جهداً عقلياً وذهنياً dS‏ وقد لا يستطيع بند 
واحد الكشف عن تعقيد الظاهرة محل الاهتمام. وفي ظروف كهذه. قد يكون المقياس 
هو أداه التقييم الأكثر ملاءمة. وقد تتمكن بنود متعددة من الكشف عن جوهر مثل هذا 
المتغير بدرجة من الدقة التي لا يمكن أن يحققها بند واحد. وهذا النوع من المتغيرات 
تحديداً - وهو المتغير الذي لا يمكن ملاحظته مباشرة Gilly‏ ينطوي على التفكير من جانب 
المستجيبين - هو الذي يتم تقييمه بشكل مناسب من خلال مقياس. 


وينبغي مقارنة المقياس بأنواع أخرى من المقايبس المتعددة البنود التي تسفر عن درجة مركبة. 
والتمييز بين هذه الأنواع ا مختلفة من البنود المركبة GIS‏ أهميه نظرية وعمليه على حد سواء 
كما ستكشف الفصول اللاحقة. ووفقاً للمصطلحات المستخدمة في هذا الكتاب» فإن المقياس 
يتكون كما أشار «بولين» )65 - 64 pp.‏ ,1989؛ انظر أيضاً 200-202 (Loehlin, 1998, pp.‏ من 
”مؤشرات التأثير“ effect indicators‏ - وهي البنود التي تكون قيمتها ناتجة من المفهوم SUI‏ 
الأماسي gl)‏ متغير كامن, كما سنشير إليها في الفصل Weg (YL‏ ما يتفق مقياس الاكتئاب مع 
خصائص المقياس» حيث إن الاستجابات على كل بند من البنود على حدة التي تتقاسم أو تشترك 
في قضية dale‏ - وتسمى الحالة الوجدانية للمستجيب. وهكذاء فإن كيفية استجابة شخص ما 
لبنود مثل ”أشعر بالحزن“ و”حياتي كئيبة“ رها تحددها إلى حد كبير مشاعر ذلك الشخص في 
ذلك الوقت. سأستخدم مصطلح «دليل» index‏ من ناحية أخرى: لوصف مجموعات من البنود 
التي تسبب مؤشرات - أي البنود التي تحدد مستوي مفهوم بنائي lo‏ فعلي سبيل Lb‏ من 
الممكن أن يكون قياس جاذبية المرشح الرئاسي مناسباً لخصائص الدليل index‏ وقد تقوم هذه 
البنود بتقييم مكان الإقامة الجغرافية للمرشح. وحجم أسرتهء وجاذبيته الماديةء وقدرته على 
إلهام العاملين في الحملة الانتخابية» والموارد المالية المحتملة. وعلى الرغم من أن هذه الخصائص 
رها لا تشترك في أي قضية dole‏ إلا أنها قد تتشارك جميعها في التأثير - مما يزيد من احتمال 
نجاح الحملة الرئاسية. فالبنود ليست نتيجة لشيء واحد, ولكنها تحدد النتيجة نفسها. وهناك 
مصطلح أكثر عمومية لمجموعه من البنود التي يمكن تجميعها في درجة مركبة هو المتغير GALI‏ 
emergent variable‏ (على سبيل «Cohen, Cohen, Teresi, Marchi, & Velez, 1990 «Jll‏ 
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والذي يتضمن مجموعات من الكيانات التي تشترك في خصائص معينة ويمكن تجميعها تحت 
عنوان فئة مشتركه. غير أن تجميعهم معاً لا يعني بالضرورة وجود أي علاقة سببيه. فالجمل 
التي تبدأ بكلمة لها أقل من خمسة أحرف» على سبيل JEM‏ يمكن تصنيفها بسهوله معاً على 
الرغم من أنها لا تشترك في قضية مشتركة ولا في أي أثر مشترك. إن المتغير الناشئ ينبثق لمجرد 
أن شخصاً ما أو شيئاً ما (مثل برنامج تحليل البيانات) يرى نوعاً من التشابه بين البنود اممعنية. 


جميع المقاييس ليست متساوية: 


للأمف. 6 يتم تطوير جميع البنود المركبة بعناية. وبالنسبة للكثيرين» قد يكون التجميع 
مصطلح أكثر ملاءمة من التطوير. Le WE‏ يقوم الباحثون بحذف البنود أو تجميعها معاً 
وافتراض أنها تشكل مقياسًا مناسبًا. قد لا يفكر هؤلاء الباحثون فيما إذا كانت البنود تشترك 
في قضية dole‏ (وبالتالي تشكل مقياسًا (scale‏ أو تشترك في إحداث نتيجة أو عاقبة مشتركة 
(وبالتالي تشكل دليل (index‏ أو مجرد أمثلة لفئة أهداف مرتبة مشتركة لا تنطوي على أي 
مقدمات سببية dole‏ أو نتيجة (وبالتالي تشكل feio‏ ناشئا). 

لا يفشل الباحث في استغلال النظرية في تطوير المقياس فحسب» بل قد يتوصل أيضًا 
إلى استنتاجات خاطئة حول النظرية من خلال إساءة تفسير ما يقيسه المقياس. وهناك 
pal‏ مؤسف ولكنه متكرر بشكل مقلق للغاية هو استنتاج أن بعض المفاهيم البنائية غير 
مهمة أو أن نظرية معينة غير متناسقة بناءً على أداء مقياس قد لا يعكس المتغير الذي 
يفترضه الباحث. اذا قد يحدث هذا؟ في البحوث Hob‏ ما نقوم بدراسة العلاقات بين 
المتغيرات بشكل مباشر. LSS LS‏ سابقًاء فإن العديد من المتغيرات محل الاهتمام لا Se‏ 
ملاحظتها مباشرة. وهذه حقيقة يمكننا نسيانها بسهولة. وفي كثير من OLE‏ فإننا نقوم 
بتقييم العلاقات بين ممثلين عن المتغيرات أو «وكلاء» proxies‏ (مثل المقاييس) التي تهدف 
إلى تمثيل متغيرات محل الاهتمام. قد يصبح هناك خلط بين الوكيل أو الممثل proxy‏ 
القابل للملاحظة والمتغير الذي لا يمكن ملاحظته. على سبيل Eb‏ يبدو أن متغيرات Jie‏ 
ضغط الدم ودرجة حرارة الجسم في الاعتبار الأول يمكن ملاحظتهما بشكل مباشرء ولكن 
ما نلاحظه فعليًا عبارة عن وكلاءء مثل عمود الزئبق. تفترض استنتاجاتنا حول المتغيرات 


ty‏ تطوير المقاييس: النظرية والتطبيق 


dole نظرة‎ 


أن الوكلاء الذين تتم ملاحظتهم يرتبطون lol‏ وثيقًا با متغيرات الأساسية التي ممثلونها. 
هذا هو الحال بالنسبة قياس الحرارة؛ إننا نصف مستوى الزئبق في مقياس الحرارة DL‏ 
”درجة الحرارة“ على الرغم من أنه بالمعنى الدقيق للكلمة» هو مجرد مظهر Gyo‏ لدرجة 
الحرارة gl)‏ الطاقة الحرارية). في هذه led!‏ حيث يتطابق الطرفان عن كثب» تكون 
عواقب الإشارة إلى القياس (قيمة المقياس التي يصل إليها الزئبق) كمتغير (كمية الطاقة 
الحرارية) تكاد تكون دانماً غير ذات أهمية. عندما تكون العلاقة بين المتغير ومؤشره أضعف 
مما هي عليه في مثال مقياس الحرارةء فإن الخلط بين المقياس والظاهرة التي يهدف إلى 
كشفها يمكن أن يؤدي إلى استنتاجات خاطئة. لنأخذ في الاعتبار حالة افتراضية يرغب 
فيها الباحث في إجراء تحليل ثانوي لمجموعة بيانات موجودة. ولنفترض أن هذا الباحث 
مهتم بدراسة دور الدعم الاجتماعي في التحصيل المهني اللاحق. ويلاحظ الباحث أن 
مجموعة البيانات المتاحة تحتوي على ثروة من المعلومات حول الأوضاع المهنية للأشخاص 
على مدى فترة زمنية طويلة وأن الأشخاص قد تم سؤالهم عما إذا كانوا متزوجين آم لا. في 
الواقعء قد يكون هناك العديد من البنود التي تم جمعها في أوقات مختلفةء والتي تتعلق 
بالزواج. ولنفترض WIS‏ في حالة عدم وجود أي بيانات توفر تقييماً أكثر تفصيلاً للدعم 
الاجتماعي» يقرر Coll‏ جمع بنود الزواج هذه في ”مقياس“ وأن يستخدم ذلك كمقياس 
للدعم. ويتفق معظم علماء العلوم الاجتماعية على أن مساواة الدعم الاجتماعي بالحالة 
الزواجية ليس له ما يبرره. حيث يسقط هذا الأخير ويلغي جانبين مهمين من جوانب 
الدعم الاجتماعي (على سبيل JELI‏ إدراك نوعية أو جودة الدعم الذي يتم الحصول (ale‏ 
ويتضمن عوامل يحتمل أنها غير ذات صلة با موضوع Ue)‏ سبيل JEL‏ حالة طفل صغير 
جداً بحيث لا يتمكن من الزواج مقابل شخص بالغ في سن مناسب للزواج في وقت القياس). 
إذا استنتج هذا الباحث الافتراضي» استناداً إلى طريقة التقييم ode‏ أن الدعم الاجتماعي 
م يلعب أي دور في تحقيق التحصيل ال مهني» فإن هذا الاستنتاج قد يكون LE ELE‏ في 
الواقع» كانت المقارنة بين الحالة الزواجية والتحصيل المهني (أو. على نحو أدق. مؤشرات 
هذين المتغيرين). ولا يكون الاستنتاج المتعلق بالدعم والتحصيل المهني صحيحاً Balos‏ إلا 
إذا أشار الزواج فعلاً إلى مستوي الدعم. 


تطوير المقاييس: النظرية والتطبيق ey‏ 


الفصل الأول 


تكلفة سوء أو ضعف القياس: 

وحتى إذا كان القياس السين هو المقياس الوحيد المتاح» فإن تكاليف استخدامه قد تكون 
أكبر من أي فوائد يمكن تحقيقها. والحالات نادرة في العلوم الاجتماعية التي يجب أن يُتخذ 
فيها قرار فوري من أجل تجنب العواقب الوخيمة: وليس أمام المرء خيار آخر سوى القيام 
باستخدام أفضل الأدوات المتاحة. ولكن حتى في هذه الحالات Sold!‏ لا تختفي وتتلاثى 
ا مشاكل المتأصلة في استخدام المقاييس الرديئة لتقييم المفاهيم البنائية. إن استخدام قياس 
لا يقوم بتقييم ما يفترضه المرء يمكن أن يؤدي إلى قرارات خاطئة. هل هذا يعني أننا ينبغي 
أن نستخدم فقط أدوات القياس التي خضعت للتطوير الدقيق واختبار الصدق الشامل؟ 
Les‏ الرغم من أن القياس المعيب أو الناقص قد يكون أفضل من عدم وجود قياس على 
الإطلاق في بعض الحالات» فإنه ينبغي أن ندرك متى تكون إجراءات القياس الخاصة بنا بها 
عيوب وأن نقلل من استنتاجنا وفقاً لذلك. 

في كثير من GLE!‏ سوف يعتبر الباحث القياس كمسألة ثانوية لقضايا علمية أكثر 
أهمية والتي تكون حافزاً على الدراسة» وبالتالي» سيحاول الباحث أن يقتصد من خلال 
الحد من عملية القياس. ومع EUS‏ فإن المقاييس المناسبة هي شرط ضروري لإجراء بحوث 
سليمة وصادقة. ويجب على الباحثين السعي لتحقيق التماثل بين المفاهيم البنائية النظرية 
محل اهتمامهم وطرق القياس التي يستخدمونها لقياسها إجرائياً. ويفرض سوء أو ضعف 
القياس قيودا كبيرة على صدق الاستنتاجات التي هكن الوصول إليها. بالنسبة للباحث الذي 
Lai‏ أن يولي قدراً ضئيلاً من الاهتمام للقياس وأكبر قدر ممكن للقضايا الموضوعية؛ OB‏ 
الإستراتيجية ا مناسبة قد تتمثل في تصحيح الجزء الخاص بالقياس منذ البداية المبكرة للبحث 
حتى يمكن اعتباره أمراً مفروعًا dio‏ أو مسلماً به إلى حد ما بعد ذلك. 


يمكن للباحث LAT‏ أن يقتصد بشكل خاطئ من خلال استخدام المقاييس المختصرة جداً 
على أمل تخفيف العبء على المستجيبين. إن الاستبانة التي تكون مختصرة Me‏ لكي تتمتع 
بالثبات تعد فكرة سيئة بصرف النظر عن عدد المستجيبين الذين يفضلون الإيجاز. وينتج عن 
الاستبانة التي تتمتع بالثبات ويتم إكمال الإجابة عليها من قبل نصف المستجيبين معلومات 
أكثر من الاستبانة التي لا تتمتع بالثبات وتم الحصول على إجابة جميع المستجيبين عليها. 
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إذا م تتمكن من تحديد ما تعنيه البيانات» فكمية المعلومات التي يتم جمعها تكون غير 
ذات صلة وغير مناسبة. وبالتاليء فإن استكمال الإجابة على الاستبانات «املائمة» التي 
لا هكن أن تسفر عن معلومات spre GIS‏ هو استخدام سيئ لوقت المستجيبين وجهدهم 
مقارنة باستكمالهم نسخة أطول إلى حد ما تنتج بيانات صادقة. وبالتالي» فإن استخدام 
أساليب وطرق تقييم مختصرة وغير كافية قد يكون لها آثار أخلاقية وكذلك آثار علمية. 


الملخص والمراجعة: 

يؤكد هذا الفصل على أن القياس blis‏ أساسي في جميع فروع العلوم» Le‏ في ذلك العلوم 
السلوكية والاجتماعية. وللقياس النفسي» وهو مجال التخصص في العلوم الاجتماعية اللعني 
بقياس الظواهر الاجتماعية والنفسية» سوابق تاريخية تمتد إلى العصور القديمة. في العلوم 
الاجتماعية: تلعب النظرية دوراً حيوياً في تطوير القياس والمقاييسء Gilly‏ هي مجموعات 
من البنود التي تكشف عن مستوى متغير نظري أساسي. ومع US‏ لا تشكل جميع 
مجموعات البنود مقاييس بهذا المعنى. وقد يكون تطوير اممقاييس أكثر صعوبة من اختيار 
البنود بشكل عرضي؛ ومع EUS‏ فإن تكاليف استخدام المقاييس المبنية بشكل عرضي Bole‏ 
ما تفوق الفوائد والمنافع المتحققة إلى حد كبير. 

تغطي الفصول التالية الأساس المنطقي وأساليب تطوير المقياس بمزيد من التفصيل. 
حيث يستكشف الفصل الثاني المتغير الكامن» وهو المفهوم الأساسي الذي يحاول المقياس 
قياسه كمياًء ويعرض الأمس النظرية للأساليب التي تم وصفها في الفصول اللاحقة. ويقدم 
الفصل الثالث أساساً مفاهيمياً لفهم الثبات والمنطق الكامن وراء معامل الثبات. ويستعرض 
الفصل الرابع الصلاحية أو الصدقء في حين أن الفصل الخامس هو دليل عملي للخطوات 
التي ينطوي عليها وضع وتطوير المقياس. ويقدم الفصل السادس مفاهيم التحليل العاملي 
ويصف استخدامها في تطوير المقياس. والفصل السابع هو نظرة عامه مفاهيمية لمدخل 
بديل لتطوير المقياس - نظرية استجابة البند. وأخيراً يناقش الفصل الثامن بإيجاز كيفية 
تناسب المقاييس مع عمليه البحث الأوسع نطاقاً. 
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تمارين: 

-١‏ ما هي الاختلافات الرئيسية بين المقياس (scale)‏ والدليل (index)‏ كما تم وصفهم؟ 

-Y‏ هناك مهنتان لهما تاريخ طويل في التقييم هما التعليم (من خلال تطوير واستخدام 
اختبارات القدرة الموحدة) والطب النفسي (من خلال مواصفات وتطبيق معايير 
التشخيص امعياري أو الموحد). ما هي بعض الاختلافات الرئيسية بين كيفية اقتراب 
هذين المجالين البحثيين من مجال التقييم؟ 
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يقدم هذا الفصل مخططًا وتصوراً مفاهيميًا لفهم العلاقة بين المقاييس والمفاهيم 
البنائية constructs‏ التي تمثلهاء على الرغم من أنه ليس الإطار الوحيد اممتاح. وتّعد نظرية 
استجابة البند منظور قياس بديل والذي سنقوم بدراسته في الفصل السابع. ونظرًا BY‏ إطار 
مفاهيمي مهم OSEI‏ حسابه واستخدامه على نطاق واسع» فإنني أؤكد على نموذج القياس 
الكلاسيكيء الذي يفترض أن كل بند من البنود على حدة هي مؤشرات قابلة للمقارنة مع 
المفاهيم البنائية الأساسية. 


المفاهيم البنائية (constructs)‏ مقابل المقاييس: 


bole‏ ما يهتم الباحثون بالمفاهيم البنائية بدلاً من البنود أو المقاييس في حد ذاتها. على 
سبيل Sb!‏ سيكون باحث في مجال التسويق يهدف إلى قياس تطلعات الوالدين تجاه 
أطفالهم أكثر اهتمامًا بالمشاعر الأبوية غير الملموسة والآمال فيما سينجزه أطفالهم مقارنة 
با مكان الذي يضع فيه هؤلاء الآباء علامات على الاستبانة. ومع US‏ فإن تسجيل الاستجابات 
على استبانة قد يكون» في كثير من الحالات» أفضل طريقة لتقييم تلك المشاعر والآمال. Boles‏ 
ما تكون بنود المقياس وسيلة نهائية لتقييم ا مفهوم البنائي. وبعبارة أآخرى الاستبانة ضرورية 
لأن العديد من المفاهيم AGLI!‏ لا مكن تقييمها مباشرةً. معنىء» أن المقاييس تعتبر وكلاء 
(proxies)‏ للمتغيرات التي لا يمكننا ملاحظتها بشكل مباشر. ومن خلال تقييم العلاقات بين 
ا مقاييس» نستنتج بشكل غير مباشر العلاقات بين المفاهيم البنائية. في الشكل رقم »)١-۲(‏ 
على سبيل JUL‏ على الرغم من أن اهتمامنا الأماسي هو العلاقة بين المتغيرين A‏ و8 فإننا 
نقدر تلك العلاقة على أساس العلاقة بين المقاييس ALLL!‏ لتلك المتغيرات. 

وغالبًا ما تسمى الظاهرة الأساسية أو المفهوم البنائي الأساسي المراد أن يعكسه المقياس بالمتغير 
الكامن (latent variable)‏ ما هو المتغير الكامن بالضبط؟ يكشف مسمى المتغير الكامن عن 
اثنين من السمات الرئيسية. فبالنظر إلى JELI‏ الخاص بتطلعات Ub LYI‏ سينجزه الأطفال. 
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Voi‏ إن هذه التطلعات كامنة وليست ظاهرة أو واضحة. فطموحات الآباء لإنجازات أطفالهم 
لا مكن ملاحظتها بصورة مباشرة. بالإضافة إلى ذلك فإن eg gab!‏ البنائي الخاص بطموحات 
وتطلعات الآباء لإنجازات أطفالهم هو متغير وليس Cob‏ - أي إن بعض جوانبه متغيرة مثل 
قوته (شدته)» أو مقداره (أهميته). فقد تختلف تطلعات الآباء بشأن إنجازات أطفالهم وفقًا 
للوقت de)‏ سبيل JELI‏ خلال مرحلة طفولتهم مقابل مرحلة (iiol hl‏ والمكان de)‏ سبيل 
ا مثال» في مجال رياضي مقابل الفصل الدراسي)» أو أشخاص (مثل الآباء الذين تختلف خلفياتهم 
أو وظائفهم) أو أي مزيج من هذه الأبعاد وغيرها. والمتغير الكامن هو الظاهرة الفعلية التي 
تكون موضع الاهتمام - في هذه الحالةء هو تطلعات الآباء لإنجازات الطفل. 

ونمة جانب آخر جدير بالملاحظة في المتغير الكامن» هو أنه dole‏ ما يكون سمة من 
سمات الفرد الذي هو مصدر البيانات. وهكذاء في مثالنا fled!‏ فإن تطلعات الآباء هي سمة 
من سمات الآباء وليس الأطفال. ووفقًا HUY‏ فإننا نقوم بتقييمه من خلال جمع بيانات 
حول معتقدات الآباء من الآباء أنفسهم. في حين أنه قد تكون هناك ظروف يكون فيها 
شكل ما من أشكال إعطاء المعلومات بالوكالة أو النيابة عن الغير (على سبيل المثالء مطالبة 
الوالدين بإعطاء معلومات عن بعض خصائص أطفالهم) أمراً مناسباً. بشكل ple‏ سنطلب 
من المستجيبين أن يقرروا ذاتياً المعلومات اممتعلقة بأنفسهم. وعندما لا يكون الأمر VIS‏ 
كما هو الحال في دراسة تشمل LV!‏ الذين يصفون تطلعات أطفالهم لأنفسهم» يجب توخي 
الحذر عند تفسير المعلومات الناتجة عن ذلك. 

ويمكن القولء في هذه الحالة الافتراضيةء Gl‏ المتغير الكامن مكن وصفه بشكل أكثر دقة 
على أنه تصورات الآباء لتطلعات أطفالهم وليس تطلعات الأطفال في حد ذاتها. وبا مثل IS}‏ 
طلبنا من مجموعة من المتسوقين تقييم خصائص متجر معينء فإننا نقوم بتقييم تصورات 
المتسوقين بدلاً من جوانب المتجر نفسه (والتي يمكن تقييمها بسهولة أكبر عن طريق الملاحظة 
المباشرة). إن درجة أهمية التمييز بين تقييم تصورات المستجيبين فيما يتعلق ببعض المحفزات 
الخارجية (على سبيل JEI‏ التصورات المتعلقة با متجر)» مقارنةً بخصائص المحفزات الخارجية 
(على سبيل JELI‏ المتجر نفسه)» سوف تعتمد على الظروف والأهداف المحددة للتقييم. ومع 
ذلك وف جميع الحالات» من المهم مراعاة هذا التمييز وتقديم تفسيرات مناسبة للبيانات 
الناتجة عن ذلك. 
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شكل :)١-۲(‏ تتطابق العلاقات بين الأدوات (المقاييس) مع العلاقات بين المتغيرات الكامنة فقط 
عندما يتطابق كل مقياس مع المتغير الكامن الخاص به 


وعلى الرغم من أننا لا نستطيع أن نلاحظه أو نحدده LoS‏ بشكل مباشرء فمن المفترض 
أن المتغير الكامن يأخذ dod‏ محددة في إطار مجموعة محددة من الشروط. وال مقصد من 
المقياس الذي تم تطويره لقياس متغير كامن هو تقدير مقداره الفعلي في وقت ومكان 
القياس لكل شيء يتم قياسه. هذا المقدار الفعلي الذي لا يمكن ملاحظته هو الدرجة 
iii‏ 


موك 


ينطوي مفهوم المتغير الكامن على وجود علاقة معيّنة diy‏ وبين البنود التي تعبر عنه. 
ويُعتبر المتغير الكامن Law‏ في درجة البند - أي قوة أو مقدار المتغير الكامن (أي قيمة درجاته 
الحقيقية) يُفترض أنها تتسبب في البند (أو مجموعة من البنود) للحصول على قيمة معينة. 

ومن الأمثلة التي قد تعزز هذه النقطة: فيما يلي مجموعة بنود افتراضية لتقييم 
تطلعات الآباء لإنجازات الطفل: 

-١‏ إنجازات طفلي تحدد نجاحي. 
-y‏ سأفعل آي شيء تقريبًا لضمان نجاح طفلي. 
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"- ليست تضحية كبيرة إذا ساعدت طفلي على تحقيق النجاح. 
€- إنجازات ab‏ أكثر أهمية بالنسبة لي من أي شيء آخر Sg‏ التفكير فيه. 

إذا تم إعطاء الفرصة للآباء للتعبير عن مدى موافقتهم القوية على كل بند من هذه 
البنود. فإن تطلعاتهم الكامنة لإنجازات الطفولة ينبغي أن تؤثر على استجاباتهم. وبعبارة 
أخرىء ينبغي لكل بند أن Quy‏ مدى قوة المتغير الكامن (التطلعات لإنجازات الأطفال). 
والدرجات التي يتم الحصول عليها في البند هي نتيجة ناجمة عن قوة أو مقدار المتغير 
الكامن بالنسبة لذلك الشخص في ذلك الوقت بالذات. 

وتنطوي العلاقة السببية بين متغير كامن ومقياس على علاقات تجريبية معينة. على سبيل 
المثالء إذا كانت قيمة البند ناتجة عن متغير كامن» فينبغي أن يكون هناك ارتباط بين 
هذه القيمة والدرجة الحقيقية للمتغير الكامن. وكنتيجة لارتباط كل مؤشر من المؤشرات 
با متغير الكامنء فإنه ينبغي أن ترتبط هذه المؤشرات أيضًا مع بعضها البعض. ونظرًا WY‏ 
لا نستطيع تقييم الدرجة الحقيقية بشكل مباشرء فإننا لا نستطيع حساب الارتباط بينها 
وبين البند. ومع WS‏ عندما ندرس مجموعة من البنود التي يُفترض أنها ناتجة عن نفس 
المتغير الكامن» فإنه يمكننا أن نفحص وندرس علاقاتها مع بعضها البعض. لذلكء إذا كانت 
لدينا عدة بنود مثل تلك المذكورة أعلاه والتي تقيس طموحات الآباء لإنجازات الأطفالء 
LUX,‏ أن ننظر مباشرة في LAS‏ ارتباطها مع بعضها البعضء ونستدعي المتغير الكامن 
كأساس للارتباطات بين البنود» olg‏ نستخدم هذه المعلومات للاستنتاج والاستدلال على 
مدى ارتباط كل بند ارتباطاً قوياً بالمتغير الكامن. وسأشرح بعد قليل كيف هكن أن نتعلم 
ونستفيد من كل هذا من خلال الارتباطات المتبادلة بين البنود. Nol‏ ومع Gow EUS‏ أقوم 
بعرض بعض الإجراءات التخطيطية للمساعدة في جعل هذا التفسير أكثر وضوحاً. 


مخططات المسار: 


J E A‏ هذا الموضوع على استعراض موجز للقضايا ذات الصلة بتطوير المقياس. 
ولمزيد من التعمة في هذا الموضوع يمكن الرجوع إلى «أشير» )1983 (Asher,‏ أو ”لوهلين“ 
.(Loehlin, 1998)‏ 
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الاصطلاحات التخطيطية: 


تعد مخططات المسار طريقة لوصف العلاقات السببية بين المتغيرات. وعلى الرغم من 
أنه يمكن استخدامها جنبًا إلى جنب مع تحليل المسار» وهو أسلوب تحليلي للبيانات» إلا أن 
مخططات المسار لها فائدة dole‏ أكبر كوسيلة لتحديد كيفية ارتباط مجموعة من المتغيرات 
ببعضها البعض. وتتقيد هذه المخططات ببعض الاصطلاحات. حيث يشير السهم المستقيم 
المرسوم من اسم متغير إلى اسم متغير آخر إلى أن المتغيرين الاثنين مرتبطان سببياً وأن اتجاه 
السببية هو ما يشير إليه السهم. وهكذاء فإن (X < Y)‏ يشير صراحة إلى أن المتغير (X)‏ هو 
سبب في حدوث المتغير (Y)‏ وفي كثير من الأحيان يتم تحديد المسارات الترابطية بواسطة 
علامات أو حروف» مثل الحرف (a)‏ في الشكل رقم(7-5). 

GLE‏ سهم ما له Lay)‏ معنى صريح» ألا وهو أن اثنين من المتغيرات لا توجد علاقة 
بينهما. Ybbs‏ فإن (A > B> C D > E)‏ تعني أن (A)‏ يسبب (B)‏ و(8) يسبب (C)‏ 
(C) ols‏ و() لا توجد علاقة login‏ وأن (D)‏ يسبب (Œ)‏ 


PEL rR 


شكل :)١-۲(‏ المسار السببي من المتغير (X)‏ إلى المتغير (Y)‏ 


وهناك اصطلاح آخر لمخططات المسار وهو طريقة تمثيل الخطأ (error)‏ والتي يتم 
تصويرها bale‏ كمتغير سببي إضافي. ومصطلح الخطأ هذا عبارة عن باقي (residual)‏ 
ويمثل كل مصادر التباين غير المحسوبة لأسباب أخرى مبينة بوضوح في الرسم التخطيطي. 

ونظرًا لأن مصطلح الخطأ هذا متبقي.ء فإنه هثل الاختلاف بين القيمة الفعلية للمتغير 
(Y)‏ والقيمة التي نتوقعها للمتغير (Y)‏ والمستندة إلى المعرفة بالمتغيرات (X)‏ و(2) (في هذه 
الحالة؛ انظر الشكل (Y-Y‏ وفي بعض الأحيان» يتم افتراض مصطلح الخطأء dlls‏ لا يتم 
تضمينه في الرسم التخطيطي. 
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مخططات المسار في تطوير المقياس: 


يمكن أن تساعدنا مخططات المسار في معرفه كيفية أو مدى ارتباط بنود المقياس بالمتغير 
الكامن سببياً. كما أنها هكن أن تساعدنا أيضاً على فهم كيف أن بعض العلاقات بين البنود 
تنطوي على علاقات معينه بين البنود والمتغير الكامن. نبدأ بدراسة قاعدة حسابيه بسيطة 
لمخططات المسار. دعنا نلقي نظرة على الرسم التخطيطي للمسار البسيط في الشكل رقم (6-7). 

الأرقام على طول المسارات هي معاملات مسار معيارية (قياسية). وكل معامل مسار 
معياري يعبر عن قوه العلاقة السببية بين المتغيرات ا مرتبطة بالسهم. إن حقيقة OS‏ 
المعاملات معيارية يعني أنها جميعاً تستخدم نفس المقياس (وحدات القياس) لقياس 
مقدار العلاقات السببية. في هذا الرسم التخطيطيء فإن المتغير(۲) هو سبب لكل من 
ا متغيرات من (X1)‏ إلى .(X5)‏ وتوجد علاقة هامة بين قيم معاملات امسار والارتباطات 
بين البنود Xs‏ (التي تمثل البنود في حاله الرسم التخطيطي مسار تطوير المقياس). بالنسبة 
للمخططات مثل هذه والتي يكون لها أصل مشترك واحد فقط GY)‏ هذه الحالة)» OB‏ 
الارتباط بين أي اثنين من البنود (Xs)‏ تساوي ناتج ضرب معاملات الأسهم التي تشكل مسار 
من خلال (Y)‏ بين المتغيرات(©2) محل الاهتمام. على سبيل المثال» يتم حساب الارتباط بين 
(K5)9 (X1)‏ عن طريق ضرب poles‏ المسارين المعياريين اللذّين يربطهما ب (Y)‏ وهكذاء 
فإن معامل الارتباط بينهما يساوي (0.06 = 0.1 .(r1,5 = 0.6 x‏ كما تشترك المتغيرات (X6)‏ 
و(067 في (Y)‏ كمصدر مشتركء لكن المسار الذي يربطهما يكون أطول. ومع US‏ فإن 
قاعدة الحساب لا تزال سارية وتنطبق في هذه الحالة. فإذا بدأنا من (X7)‏ فإنه يمكننا 
تتبع العودة إلى (Y)‏ ومن ثم التوجه إلى الأمام مرة أخرى إلى (X6)‏ (أو في الاتجاه الآخرء 
من 6× إلى .(X7‏ وتكون النتيجة على النحو التالي: (0.0072 = 0.2 x 0.3 x 0.4 x‏ 0.3( 
وهكذا تكون قيمة )6,7 (r‏ تساوي stot V¥‏ 

هذه العلاقة بين معاملات ال مسار والارتباطات توفر أساسًا لتقدير المسارات بين متغير 
كامن والبنود التي يؤثر عليها. وعلى الرغم من أن seth!‏ الكامن هو متغير افتراضي وغير 
قابل للقياس» إلا أن البنود حقيقية ويمكن حساب الارتباطات بينها بشكل مباشر. وباستخدام 
هذه الارتباطات» والقاعدة البسيطة للحساب التي تمت مناقشتها للتو. وبعض الافتراضات 
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حول العلاقات بين البنود والدرجات الحقيقية» مكننا التوصل إلى تقديرات للمسارات بين 
البنود والمتغير الكامن. ويمكننا أن نبدأ مجموعة من الارتباطات بين المتغيرات. وبعد US‏ 
بالعمل إلى الخلف أي العكس Ob‏ نبداً من العلاقة بين المسارات ULI Vg‏ يمكننا تحديد 
ما يجب أن تكون عليه قيم مسارات معينة إذا كانت الافتراضات صحيحة. دعونا ننظر في 
JULI‏ الوارد في الشكل رقم )¥-0( 








شكل (6-5): مخطط مسار ذو معاملات مسار والذي هكن استخدامه لحساب الارتباطات بين المتغيرات 
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يشبه هذا الرسم التخطيطي المثال الذي تم تناوله سابقاً في الشكل رقم )٤-۲(‏ باستثناء 
أنه لا توجد قيم مسارات» وتم حذف وإسقاط المتغيرين (X7)9 (X6)‏ وتمثل المتغيرات 
(X)‏ المتبقية بنود المقياس.ء ولكل بند متغير (خطأ (error‏ يؤثر فيه بخلاف المتغير (Y)‏ 
ومتغيرات الخطأ odale)‏ هي متغيرات فريدة من نوعها في حالة كل بند وتمثل التباين 
المتبقي في كل بند م يتم تفسيره بواسطة المتغير(لآ). ويشير هذا المخطط إلى أن كافة البنود 
تتأثر باممتغير(۲). بالإضافة إلى WS‏ يتأثر كل منها بمجموعه فريدة من المتغيرات بخلاف 
(Y) ytl‏ والتي يتم التعامل معها بشكل جماعي على أنها خطأ (error)‏ 

ويمثل هذا ال مخطط امعد لكيفية ارتباط خمسة بنود كل على حدة متغير كامن واحد 
(Y)‏ وتشير الأرقام العددية Slash!‏ لمتغيرات الخطأ (es)‏ وبنود المقياس (Xs)‏ إلى أن 
البنود الخمسة مختلفة وأن المصادر الخمسة للخطأء واحد لكل بندء هي أيضاً مختلفة. 
ولا يحتوي المخطط على أسهم للانتقال مباشرةً من بند (X)‏ إلى بند آخر (X)‏ أو الانتقال من 
متغير (e) Las‏ إلى متغير Las‏ آخر (e)‏ أو من متغير خطأ (e)‏ إلى بند (X)‏ غير تلك ا مرتبطة 
بها. وتمثل هذه الجوانب من المخطط الافتراضات التي ستتم مناقشتها Loy‏ 


شكل (0-7): مخطط مسار يتضمن متغيرات الخطأ 


إذا كانت لدينا خمسة بنود فعلية أكملت الإجابة عليها مجموعة من الأشخاص» 
فستكون لدينا درجات بند يمكن أن نربطها مع بعضها بعد ذلك. ولقد سمحت القاعدة 
التي تمت دراستها ف وقت سابق بحساب الارتباطات من معاملات المسار. ومع إضافة 
بعض الافتراضات» فإنه يتيح لنا Léi‏ حساب معاملات المسار من الارتباطات» أي إنه هكن 
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استخدام الارتباطات المحسوبة من البنود الفعلية لتحديد مدى ارتباط كل بند باممتغير 
الكامن. على سبيل JEL‏ إذا كان الارتباط بين (X4)9 (X1)‏ يساوي (20,65» فعندئذ 
نعرف أن ناتج قيم slab!‏ الذي يمتد من (Y)‏ إلى (X1)‏ والمسار الذي يمتد من (Y)‏ إلى (X4)‏ 
يساوي (١٤,٠).ونحن‏ نعرف هذا لأن قاعدتنا الحسابية أثبتت أن الارتباط بين متغيرين 
يساوي ناتج ضرب معاملات المسار على طول المسار الذي يربطهما معاً. وإذا افترضنا أيضًا 
أن قيمتي المسار متساويةء فيجب أن يكون كلاهما EVE)‏ 


مزيد من التوسع في نموذج القياس: 
افتراضات القياس الكلاسيكية (التقليدية): 
إن نموذج القياس الكلاسيكي أو التقليدي - الذي يؤكد أن الدرجة الملاحظة (X)‏ الناتجة 


عن حاصل جمع الدرجات (T) Viii‏ بالإضافة إلى Las‏ القياس (e)‏ - تبدأ بافتراضات 
dole‏ حول البنود وعلاقاتها با متغير الكامن ومصادر الخطأ. وهذه الافتراضات هي: 


-١‏ يختلف مقدار الخطأ المرتبط بكل بند من البنود على حدة بشكل عشوائي. ويكون 
للخطأ المرتبط بكل بند من البنود على حدة متوسط يساوي (صفراً) عند تجميعه عبر 
ous‏ كبير من الأشخاص. وبالتاليء فإن متوسطات البنود تميل إلى عدم التأثر بالخطأ 
عندما يكمل sus‏ كبير من ال مجيبين الإجابة على البنود. 

-Y‏ لا يرتبط متغير الخطأ (error term)‏ لأي بند مع متغير الخطأ لبند آخر. أما المسارات 
الوحيدة التي تربط البنود فهي تمر Lalo‏ عبر المتغير الكامن» ولا تمر أبداً عبر أي متغير للخطأ. 

-Y‏ لا ترتبط متغيرات الخطأ مع الدرجة الحقيقية للمتغير الكامن. لاحظ أن ا لمسارات 
ا منبثقة من المتغير الكامن لا تمتد للخارج إلى متغير الخطأ. ويستهدف السهم بين بند 
ما ومتغير الخطأ الخاص الاتجاه الآخر. 


(Y)‏ الدرجة الحقيقية هي مفهوم افتراضيء يشير إلى خصائص لا يمكن ملاحظتهاء ولا هكن قياسها بشكل مباشر. وتُعرف 
إجرائياً بأنها متوسط درجات الفرد المتوقعة على سمة أو متغير معين عند قياس السمة أو المتغير عدداً لا نهائياً من 
المرات. وبسبب عدم إمكانية dole]‏ تطبيق الاختبار على الفرد إلى ما لا نهاية فإن إمكانية التحديد التام للدرجة 


الحقيقية يعد أمراً تقريبياً (المترجمّين). 
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الافتراضان الأول والثاني أعلاه هما افتراصين إحصائيّين شائعين تكمنان أو تقفان وراء 
العديد من الإجراءات التحليلية. أما الافتراض الثالث فهو تعريف ”الخطأ“ على أنه الباقي 
أو المتبقي بعد الأخذ في الاعتبار كل العلاقات بين مجموعه من المنبآت والنتيجة gl‏ في هذه 


الحالة» مجموعه من البنود ومتغيرها الكامن. 


الاختبارات المتكافئة (المتوازية): 

تعتمد نظرية القياس الكلاسيكيةء في شكلها الأكثر تقليدية. على افتراض اختبارات 
التكافؤ أو التوازي parallel tests‏ وينبع مصطلح ”اختبارات التكافؤ“ من حقيقة أنه هكن 
للمرء أن ينظر إلى كل بند على حدة على أنه ”اختبار“ لقيمة المتغير الكامن. ولأغراضناء 
فإن الإشارة إلى البنود المتكافئة ستكون أكثر دقة. ومع ذلك. سوف أؤجل استخدام ذلك 
وأستخدم الاسم التقليدي. 

ومن مزايا نموذج اختبارات التكافؤ أن افتراضاته تجعل من السهل للغاية التوصل إلى 
استنتاجات مفيدة حول كيفية ارتباط كل بندين من البنود على حدة بالمتغير الكامن Flo‏ 
على ملاحظاتنا عن LAS‏ ارتباط البنود ببعضها البعض. في وقت سابقء اقترحت أنه بمعرفة 
الارتباطات بين البنود وفي ظل افتراضات معينةء هكن للمرء عمل استدلالات واستنتاجات 
بشأن المسارات المؤدية من متغير سببي إلى بند ما. كما هو Que‏ في الفصل التاليء OL‏ 
القدرة على تعيين وتحديد قيمة رقمية للعلاقات بين المتغير الكامن والبنود نفسها مهمة 
جدًا. ومن ثم فإنني» في هذا القسم» سأبحث بشيء من التفصيل كيف تؤدي افتراضات 
اختبارات التكافؤ إلى استنتاجات معينة تجعل ذلك ممكتًا. 

والأساس المنطقي الذي يقوم عليه نموذج الاختبارات المتكافئة هو أن كل بند من بنود 
المقياس هو على وجه التحديد مقياس جيد للمتغير الكامن مثل أي بند آخر من بنود 
المقياس. وبالتالي» فإن كل بند من البنود تكون متكافئة تماماً أي إن Be‏ كل بند بالمتغير 
الكامن يُفترض أنها متطابقة مع علاقة كل ay‏ آخر بهذا المتغير ويُفترض أيضاً أن يكون 
مقدار الخطأ الموجود في كل بند متطابقًا أيضًا. وبشكل تخطيطي» يمكن تمثيل هذا النموذج 
على النحو المبين في الشكل رقم .)١-۲(‏ 
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ويضيف هذا النموذج افتراضين إلى تلك الافتراضات المذكورة آنفاً وهما: 
-١‏ يفترض أن يكون مقدار التأثير من المتغير الكامن لكل بند هو نفسه بالنسبة لجميع البنود. 
-Y‏ يفترض أن يحتوي كل بند نفس مقدار الخطأ لأي بند آخر, مما يعني أن تأثير العوامل 

الأخرى غير المتغير الكامن متساو لكافة البنود. 

تعني هذه الافتراضات المضافة أن ارتباطات كل بند والدرجة الحقيقية تكون متطابقة. 
والقدرة على التأكيد بأن هذه العلاقات متساوية هو أمر مهم لأنها تؤدي إلى وجود وسيلة 
لتحديد dad‏ كل من هذه الارتباطات المتطابقة أو المتماثلة. وهذا بدوره يؤدي إلى طريقة 
لقياس مدى الثبات» والذي ستتم مناقشتها في الفصل التالي. 

إن التأكيد على ان الارتباطات بين الدرجة الحقيقية وكل بند متساوية يتطلب كل 
الافتراضات السابقة. ومربع الارتباط هو نسبه التباين المشترك بين متغيرين. لذلكء إذا 
كانت الارتباطات بين الدرجة الحقيقية وكل بند من بندين متساوية» فإن نسب التباين 
المشترك بين الدرجة الحقيقية وكل بند يجب أن تكون متساوية أيضاً. افترض أن الدرجة 
الحقيقية تسهم بنفس مقدار التباين لكل بند من البندين. فإن هذا المقدار يمكن أن 
يكون نسبه متساوية من التباين الكلي لكل بند فقط إذا كانت البنود لها تباينات كلية 
متطابقة. ولكي تكون التباينات الكلية متساوية للبندينء فإنه يجب أن يكون مقدار التباين 
الذي يتلقاه كل بند من مصادر أخرى غير الدرجة الحقيقية متساو أيضاً. ونظرًا لأن كل 
مصادر التباين بخلاف الدرجة الحقيقية يتم تجميعها Leo‏ أنها las‏ فإن هذا يعني أنه 
يجب أن يكون للبندين تباينات Lhd‏ متساوية. على سبيل JEBI‏ إذا حصلت (X1)‏ على 
تسع وحدات عشوائية من التباين من درجتها الحقيقية ووحدة واحدة من الخطأء فإن 
نسبة الدرجة الحقيقية ستكون )+48( من التباين الكلي. إذا حصلت (X2)‏ أيضًا على تسع 
وحدات تباين من الدرجة الحقيقية. فإن هذه الوحدات التسع هكن أن تكون )+49( من 
الإجمالي فقط إذا كان التباين AII‏ يساوي .)٠١(‏ ولا يمكن أن يساوي المجموع القيمة 
)٠١(‏ إلا إذا ساهم الخطأ بوحدة واحدة في (X2)‏ مثلما ساهمت في (1×). OB isis‏ 
الارتباط بين كل بند والدرجة الحقيقية يساوي الجذر التربيعي لنسبة تباين كل بند الذي 
يعزى إلى الدرجة الحقيقيةء أو ما يقرب من )90+( في هذه الحالة. 
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شكل )1-1(: مخطط لنموذج الاختبارات المتكافئة» حيث تكون جميع المسارات من المتغير الكامن (L)‏ إلى البنود 
(XI, X2, X3)‏ متساوية في القيمة مع بعضها البعض» وكذلك جميع المسارات من متغيرات الخطأ إلى البنود 


Why‏ نظرًا OV‏ نموذج الاختبارات المتكافئة يفترض أن مقدار التأثير من المتغير الكامن 
هو نفسه لكل بند وأن اممقدار من المصادر الأخرى (الخطأ) هي نفسها لكل بند فإن نسب 
تباين البند المنسوبة إلى متغير كامن والخطأ يكونان متساويان بالنسبة لجميع البنود. 
وهذا يعني LAI‏ أنه وفقًا لافتراضات الاختبارات المتكافئةء تكون معاملات المسار المعيارية 
من المتغير الكامن لكل بند متساوية لكافة البنود. وكان من المفترض أن تكون معاملات 
المسرر المعيارية متساوية مما أتاح لنا Ae]‏ في مثال سابق» حساب معاملات ا مسار من 
الارتباطات بين البنود. يجب أن تساعدنا قاعدة مخطط المسار المتعلقة بمعاملات امسار 
مع الارتباطات» Gilly‏ تمت مناقشتها سابقًاء في فهم سبب استمرار ووجود هذه المعادلة 
أو التكافؤ عندما يقبل ال مرء الافتراضات السابقة. 

كما أن افتراضات هذا النموذج تعني ضمنياً أن الارتباطات بين البنود تكون متطابقة 
أو متماثلة (على سبيل JELI‏ الارتباط بين (X2)9 (X1)‏ مطابق للارتباط بين (X3)9 (X1)‏ 
أو بين .(X3)9 (X2)‏ كيف نتوصل إلى هذا الاستنتاج من الافتراضات؟ الارتباطات كلها 
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متماثلة GY‏ الآلية الوحيدة لحساب الارتباط بين أي بندين هي المسار من خلال المتغير 
الكامن الذي يربط بين هذين البندين. على سبيل المثال يتم ربط (X2)9 (X1)‏ فقط 
بواسطة المسار المكون من المسارين (a2) (a1)‏ ويمكن حساب الارتباط عن طريق تتبع 
امسار الذي يربط بين البندين المعنيين وحاصل ضرب قيم المسار. بالنسبة لأي بندين من 
og idl‏ يستلزم ذلك ضرب مسارين لهما قيم متطابقة (أي, (al = a2 = a3‏ وبطبيعة 
Sled!‏ ستكون الارتباطات المحسوبة من خلال ضرب القيم المتساوية متساوية. 

كما ان الافتراضات تعني أن كل من هذه الارتباطات بين البنود تساوي مربعاً أي مساراً 
من المتغير الكامن إلى بند من البنود على حدة. كيف نصل إلى هذا الاستنتاج؟ حاصل 
ناتج ضرب مسارين مختلفين (على سبيل (a29 al JLA‏ يكون مطابقاً لمربع أي من 
ا مسارين OY‏ معاملات كلا المسارين متماثلان. إذا كانت 21 = 2ه = a3‏ وكان حاصل ضرب 
dole = (al x a2)‏ ضرب (al x a3)‏ = حاصل ضرب a2 x a3)‏ فعندكل يجب أن يساوي 
كل من هذه النواتج الأخيرة dad LAI‏ أي من ا مسارات (a)‏ مضروباً في نفسه أي مربع 
امسار (a)‏ وقد يؤدي النظر إلى الوراء في الشكل رقم (1-5) إلى توضيح هذه العلاقات 
والآثار المترتبة عليها بشكل أكبر. 

ويستنتج أيضاً من افتراضات هذا النموذج أن نسبة الخطأ ا مرتبطة JS‏ بند هو مكمل 
لنسبة التباين المرتبطة بالمتغير الكامن. وبعبارة أخرىء فإن أي SE‏ على بند معين لا يتم 
تفسيره بواسطة المتغير الكامن يجب أن يتم تفسيره بواسطة متغير الخطأ .(error)‏ ويفسر 
ويشرح هذين Ga SW‏ معاً )++ 41( من التباين في أي بند معين. وهذا ببساطه BY‏ يتم 
تعريف متغير الخطأ (©) على أنه يشمل جميع مصادر التباين في البند بخلاف المتغير الكامن. 

وتدعم هذه الافتراضات استنتاجاً واحداً آخر على الأقل؛ نظراً OY‏ كل بند يتأثر بنفس 
المقدار بالمتغير الكامن كما أن تأثير كل متغير من متغيرات الخطأ على البند المقابل له متساو 
Lash‏ فإن كافة البنود تكون لها متوسطات متساوية وتباينات متساوية. إذا كان المصدران 
الوحيدان اللذان مكن أن يؤثرا على المتوسطات هما مصدران متماثلان أو متطابقان 
بالنسبة لكافة البنود. فمن الواضح أن المتوسطات الخاصة بكافة البنود ستكون متطابقة 
أيضاً. وينطبق هذا ال منطق أيضاً على التباينات الخاصة بالبنود. 
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وي الختام» GE‏ نموذج الاختبارات المتكافئة أو المتوازية يفترض ما يلي: 
-١‏ عشوائية الخطأ. 
-Y‏ عدم bls)!‏ الأخطاء مع بعضها البعض. 
-Y‏ الأخطاء غير مرتبطة بالدرجة الحقيقية. 
€- يؤثر المتغير الكامن على جميع البنود بنفس القدر. 
0- مقدار الخطأ لكل بند يكون متساوياً. 
تسمح لنا هذه الافتراضات أن نتوصل إلى مجموعه متنوعة من الاستنتاجات امثيرة 
للاهتمام. وعلاوة على ذلك يتيح L‏ النموذج استخلاص استنتاجات حول المتغير الكامن 


بناءً على ارتباطات البنود مع بعضها البعض. ومع LUIS‏ فإن النموذج يحقق هذا العمل 
من خلال وضع افتراضات دقيقة وصارمة إلى حد ما. 


نماذج بديلة: 

وكما tou‏ فإن جميع الافتراضات المقيدة بقوة والمرتبطة بالاختبارات المتكافئة أو 
المتوازية التامة ليست ضرورية من أجل تحقيق استنتاجات مفيدة حول علاقة الدرجات 
الحقيقية بالدرجات الملاحظة. إن النموذج القائم على ما يسمى تقنياً باختبارات «gb»‏ 
المتكافئة (tau-equivalent)‏ يجعل أحد الافتراضات أكثر تحرراً - وهو أن مقدار التباين في 
الخطأ ا مرتبط ببند معين لا يلزم أن يساوي تباين الخطأ في البنود الأخرى (على سبيل JELI‏ 
od”‏ وين“ 1979 .(Allen& Yen,‏ ولكن لا تزال اختبارات ”تاو“ المتكافئة تتطلب درجات 
حقيقية متطابقة للبنود. على الرغم من أن التخفيف البسيط من هذا الافتراض يُعرف باسم 
اختبارات ”تاو“ المترادفة أو امتكافئة في gl) essentially tau-equivalent tests LN!‏ 2 
بعض الأحيان اختبارات متكافئة عشوائياً .(randomly parallel tests‏ قد يكون SY‏ زوج 
من og il‏ الخاضعة أو المقيدة باختبارات ”تاو“ المترادفة أو المتكافئة في الأساس درجات 
حقيقية تختلف باختلاف الثابت. وبطبيعة Sled)‏ فإن إضافة ثابت إلى بند واحد لا يكون 
له تأثير على أي ارتباط ينطوي على ذلك البندء لأن الارتباطات عبارة عن مقادير معيارية. 
وبالتالي» فإن العلاقة بين أي زوج من البنود أو بين الدرجة الحقيقية للبند والدرجة التي 


1 تطوير المقاييس: النظرية والتطبيق 


فهم المتغير الكامن 


حصل عليها البند لا تتأثر بالتخفيف من الافتراضات الخاصة باختبارات «تاو» المتكافئة 
الصارمة مع تلك الافتراضات الخاصة بنموذج «تاو» المترادف أو المتكافي في الأساس. OS)‏ 
ما تم قوله حتى الآن حول اختبارات «تاو» المتكافئة ينطبق أيضًا على نموذج «تاو» المترادف 
أو المتكافئ في الأماس. في أي من هاتين الحالتين» قد لا تكون القيم المعيارية للمسارات 
من المتغير الكامن لكل بند متساوية. ومع US‏ فإن القيم غير المعيارية للمسار من امتغير 
الكامن إلى كل بند asl)‏ المقدار المقابل لنسبة التأثير التي يمتلكها المتغير الكامن على كل 
بند) يفترض أنها لا تزال متطابقة بالنسبة لكافة البنود. وهذا يعني أن البنود متكافئة 
أو متوازية فيما يتعلق بمقدار تأثرها بالمتغير الكامن ولكنها لا تتأثر بالضرورة بنفس القدر 
من العوامل الخارجية التي يتم تجميعها Las leo‏ وفي JB‏ افتراضات التكافؤ ald!‏ 
لا تقوم بنود مختلفة فقط بالتأثير على الدرجة الحقيقية بنفس القدر أو الدرجة؛ بل أيضاً 
يكون GU Sb‏ الخطأ الخاصة بهم نفس التأثير. وتعد مکافی gb) «gl»‏ ”سه “هي المقابل 
اليوناني TI‏ كما هو الحال في الدرجة الحقيقية) أسهل بكثير في التعامل لأنه لا يفترض 
شرط ”تساوي الأخطاء“. ونظرًا OY‏ الأخطاء قد تختلف. فإن متوسطات وتباينات البنود قد 
تختلف LAL‏ والافتراضات الأكثر تحرراً لهذا النموذج تكون جذابة OV‏ العثور على مقاييس 
متكافئة للتباين ا متساوي هو yal‏ نادر الحدوث. ويتيح LY‏ هذا النموذج أن نتوصل إلى 
العديد من الاستنتاجات ذاتها التي توصلنا إليها كما في الاختبارات المتكافئة أو المتوازية 
التامة ولكن مع افتراضات أقل تقييدًا. وقد يرغب القراء في مقارنة هذا النموذج بمناقشة 
«نونالي وبيرنستين» )1994 (Nunnally and Bernstein,‏ لنموذج معاينة النطاق أو المجال. 


يعتبر بعض مطوري المقاييس أن نموذج ”تاو“ المترادف أو المتكافئ في الأساس هو 
نموذج مقيد ومتشدد جداً. وفي نهاية المطاف. كم مرة يمكننا أن نفترض أن كل بند 
يتأثر بالمتغير الكامن بنفس الدرجة؟ الاختبارات التي تم تطويرها في إطار ما يسمى 
بالنموذج المتقارب أو التقاربي congeneric model‏ (جوريس كوج 1971 (Jöreskog,‏ 
تخضع لمجموعه من الافتراضات الأكثر مرونة ”غير المشددة“ (انظر كارمينزء وماكلفير 
Carmines & McLver, 1981‏ ممناقشه الاختبارات المتقاربة أو (LAW‏ يفترض هذا 
النموذج (فيما يتجاوز افتراضات القياس الأساسية) بكل بساطة أن كافة البنود تشترك في 
متغير كامن ale‏ وأنها لا تحتاج إلى أن يكون لها علاقات قوية بنفس القدر مع المتغير 
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Gol!‏ ولا ينبغي أن تكون تباينات الخطأ الخاصة بها متساوية. ويجب أن يفترض اطرء 
فقط أن كل بند يعكس الدرجة الحقيقية إلى حد ما. وبطبيعة Sled!‏ فإنه كلما كان كل 
بند يرتبط بقوة بالدرجة الحقيقيةء كان المقياس أكثر GUS‏ 


المدخل الأقل تقييدًا يتمثل في نموذج العامل العام general factor‏ الذي يتيح للمتغيرات 
الكامنة المتعددة أن تشكل الأساس de gach‏ معينة من البنود. وقد ناقش كل من ”كارمينز 
وماكلفير“ )1981 «(Loehlin,1998) “jıJagl“وs (Carmines and McLver,‏ و”لونج“ 
(Long ,1983)‏ مزايا هذا النوع من النماذج العامة للغاية, وأهمها تحسين التطابق مع 
البيانات في العام الحقيقي. le leg‏ تتضمن أساليب نمذجة المعادلة البنائية التحليل العاملي 
factor analyses‏ في ماذج القياس الخاصة بها؛ وثعد الحالات التي تشكل فيها المتغيرات 
الكامنة المتعددة مجموعة من المؤشرات مثالاً على نموذج العامل العام (لويهلنء 1998 .(Loehlin,‏ 

ويُعد النموذج المتقارب أو التقاربي هو حالة خاصة لنموذج العامل gi)‏ حالة العامل 
المفرد أو الوحيد). Libby‏ فإن مقياس نموذج ”تاو“ المترادف أو المتكافئ في الأساس هو 
حالة خاصة من المقياس المتقارب - الذي يفترض أن تكون العلاقات بين البنود والمتغير 
الكامن الخاص بها متساوية. وأخيراء هثل الاختبار المتكافئ التام حالة dole‏ لنموذج «gl»‏ 
المترادف أو المتكافئ في الأساسء مما يضيف افتراض وجود علاقات متساوية بين كل بند 
ومصادر الخطأ المرتبطة به. 

وهنا تجدر الإشارة إلى إستراتيجية قياس أخرى. هذه الإستراتيجية هي نظرية الاستجابة 
للبند أو امفردة (item response theory «IRT»)‏ تم استخدام هذا المدخل في امقام 
الأول ولكن ليس بشكل agrar‏ مع بنود الاستجابة الثنائية (على سبيل Sb‏ الصحيح في 
مقابل غير الصحيح) في تطوير اختبارات القدرة. وتفترض نظرية الاستجابة للبند أن لكل 
wu‏ من البنود على حدة حساسية خاصة به prio‏ الكامن. ممثله بال منحنيات المميزة 
للبند - وهو رسم Gly‏ للعلاقة بين قيمة المتغير الكامن (على سبيل SEL!‏ القدرة) واحتمال 
استجابة معينة لأحد البنود Ue)‏ سبيل SEM‏ الإجابة عليه بشكل صحيح). وبالتالي» 
يكشف المنحنى امميز للبند عن مقدار القدرة التي يتطلبها بند ما لتتم الإجابة عليه بشكل 
صحيح. سنتناول بشكل أكبر نظرية الاستجابة للبند في الفصل السابع. 
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فيما عدا دراسة نظرية الاستجابة للبند (IRT)‏ في الفصل السابع ومناقشة التحليل 
pols!‏ في الفصل السادس» سوف نركز بشكل أساسي على النماذج المتكافئة أوالمتوازية 
ونموذج ”تاو“ المترادف أو المتكافن في الأساس وذلك لعدة أسباب. Vol‏ أنها تجسد وتمثل 
نظرية القياس «الكلاسيكية». ASE‏ أن مناقشة الآليات التي تعمل بها النماذج الأخرى 
بصورة سريعة يمكن أن تكون أمرًا aye‏ وأخيراء أثبتت النماذج الكلاسيكية أنها مفيدة 
ie‏ للعلماء الاجتماعيين الذين لديهم اهتمامات أساسية غير القياسء ومع US‏ فإنهم 
يأخذون القياس الدقيق على محمل الجد. وهذه المجموعة من الباحثين هي الجمهور 
الذي تمت كتابة هذا الكتاب له. وبالنسبة لهؤلاء الأفراد. فإن إجراءات تطوير المقياس التي 
تتبع النموذج الكلاسيي تسفر عمومًا عن مقاييس مرضية. وف الواقع» وعلى حد علمي أنه 
على الرغم من عدم وجود حصيلة متاحة بسهولة» أعتقد أنه (اختبار القدرة الخارجية) قد 
تم تطوير الغالبية العظمي من المقاييس ال معروفة وا معترف بها بدرجة كبيرة والمستخدمة 
في أبحاث العلوم الاجتماعية باستخدام مثل هذه الإجراءات. 


اختيار نموذج سببي: 

إن اختيار النموذج السببي الذي يشكل أساساً لمتغير ماء عندما يكون WS‏ ممكنًاء هكن 
أن يكون Lage Ble‏ من جوانب القياس. يمكن أحياناً تكييف مفهوم المتغير ذاته بدقة في 
بداية مشروع بحثي لجعل قياسه في النهاية أكثر سهولة وقابلية للتطبيق. على سبيل المثاله 
لنأخذ في الاعتبار أن bob‏ يريد تقييم كيفية تأثير بيئة العمل Aol!‏ على إنتاجية الموظف. 
قد يكون أحد الأساليب هو وضع قائمة طويلة من العوامل البيئية التي يُعتقد أنها تؤثر على 
الإنتاجية - مثل الإضاءة أو الإحساس بالخصوصية أو الوصول إلى جهاز حاسب J‏ - وتطوير 
أداة تجعل العاملين يحددون مدى وجود هذه العوامل في مكان عمل معين. تتمثل مشكلة 
هذا Jahl‏ أو الأسلوب في أن الأداة قد تكون في النهاية عبارة عن دليل index‏ وليست 
مقياما أو Ley‏ مزيجًا من الاثنين. أي إن المؤشرات (مثلا الإضاءة الجيدة والخصوصية 
ا معقولة والوصول إلى جهاز حاسب آلي) قد لا تشترك في الواقع في مسألة مشتركة بل قد 
يكون لها تأثير مشترك» ألا وهو تحسين dis‏ العمل. وبدلاً من EUS‏ إذا نظر الباحث في 
مشكلة القياس المحتملة في وقت مبكر من عملية البحثء فإنه رها يكون قد قرر تحديد 
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أو وضع مفهوم للمتغير بطريقة مختلفة إلى حد ما. sd‏ سبيل JEL!‏ إذا كان الباحث قد 
عرف المتغير محل الاهتمام على أنه تصورات ال موظفين لبيئة العمل فإن هذا التعريف قد 
يؤدي إلى مجموعة أكثر مرونة من البنود. على سبيل JEL‏ يمكن أن يُطلب من الموظفين 
الموافقة على بنود مثل: ”بيئة مكان العمل الخاص بتوفر الأجهزة الأساسية التي أحتاجها 
للقيام بعملي بشكل فعال“. هناء لا يكون المتغير الكامن سمه من سمات البيئة في حد 
ذاتها ولكنه تصورات الموظفين. إن الطريقة التي يدرك بها الموظفون البيئة على أنها السبب 
العام الذي يقود ردودهم على كل بند من البنود على Ste‏ أجد أنه من الأسهل افتراض أن 
الموظف لديه شعور ببيئة العمل التي ستؤدي إلى إجابات عبر مجموعه من الأسئلة حول 
مدى كفايتها بدلاً من تصور البيئة نفسها كسبب لإجابات الموظف. وعلاوة على ذلك OL‏ 
الطبيعة النفسية لتصورات Gabel!‏ قد تكون في الواقع أقرب إلى ما يعتبره الباحث ذا 
صله بالإنتاجية من مجرد وجود أو عدم وجود سمات بيئية محدده. «sl‏ إذا كان العامل 
ينظر إلى البيئة على أنها مواتية للإنتاجية قد يكون متغيراً أكثر أهميه من حكم شخص آخر 
فيما يتعلق بمدى كفاية بيئة العمل. ولذلك؛ فإن وضع تصور للمتغير محل الاهتمام بهذه 
الطريقة قد يخدم السؤال البحثي الأساسي بشكل جيد» مع احتمال تسهيل القياس النهائي 
للمتغير أيضاً. 

وبطبيعة led‏ إذا لم يكن المتغير ذاته يقدم hga‏ سببياً يتفق مع إستراتيجية القياس 
ا مباشرة» فلا ينبغي المساس بسلامة المتغير موضع الاهتمام. قد تساعد بعض المداخل 
والأساليب الباحث في التغلب على القيود المتأصلة في المتغير والطريقة التي يتم بها قياسه 
إجرائياً. ولكن إذا أمكن تبسيط تصور بديل مقبول للمتغير والنموذج الذي يربطه مؤشراته 
فقد يكون من الممكن تطوير أداة قياس تلبي وتفي بمجموعة أبسط من الافتراضات» ومن 
ثم يمكن استكشافها باستخدام أدوات تحليلية أقل تعقيدًا. ومن المؤكد أن امتلاك الأدوات 
اللازمة ole‏ مع المواقف والحالات الأكثر تعقيدًا يُعد أمراً Jie‏ ولكن تجنب تلك 
التعقيدات واستبعاد الحاجة إلى هذه الأدوات الأكثر تقدماً قد يكون أفضلء على افتراض أنه 
يحقق العدالة في المفهوم البنائي. 


w‏ تطوير المقاييس: النظرية والتطبيق 


فهم المتغير الكامن 


تمارين: 

-١‏ كيف هكننا استنتاج العلاقة بين المتغير الكامن والبندّين ال مرتبطين به على أساس 
الارتباطات بين البندين؟ 

-Y‏ ما هو الفرق الرئيسي في الافتراضات بين الاختبارات المتكافئة ونموذج «تاو» المترادف 
أو المتكافئ في الأساس؟ 

-Y‏ ما هو نموذج القياس الذي يفترض, إلى Cle‏ الافتراضات الأساسية الشائعة لجميع طرق 
القياس» أن البنود تشترك في متغير كامن مشترك؟ 

-E‏ افترض أن نموذج «تاو» المترادف أو المتكافئ في الأساس مع درجة حقيقية T‏ ومؤشرات 
A‏ و8 و0. في مثل هذا النموذج» يجب أن يكون GY‏ مؤشرين (على سبيل JEL!‏ 
(Bg A‏ والذين يشتركان في درجة حقيقية لهما تغاير مطابق للتغاير بين زوجين آخرين 
من المؤشرات (على سبيل (Co B SLAM‏ يشتركان في تلك الدرجة الحقيقية. ومع 
ذلك» لا يجب أن تكون الارتباطات بين أزواج المؤشرات المختلفة متساوية. اشرح سبب 
حدوث ذلك. 

ملاحظات: 

-١‏ على الرغم من أن (+,V+-)‏ هو أيضًا الجذر التربيعي المسموح به للقيمة (EI)‏ إلا أن 
اتخاذ القرار بين الجذر الموجب أو السالب dole‏ ما يكون أقل أهمية مما يعتده المرء. 
Ub‏ أن جميع البنود يمكن أن تكون مرتبطة بشكل إيجابي مع بعضها البعض (إذا لزم 
الأمرء من خلال عكس درجات بنود معينة. كما هو موضح في الفصل الخامس)ء O‏ 
إشارات معاملات ال مسار من امتغير الكامن لكل بند من البنود على حدة سوف تكون 
هي نفسها. لاحظء مع EUS‏ أن إعطاء إشارات إيجابية لهذه المسارات يعني ضمنياً أن 
البنود تشير إلى المفهوم GLI‏ بش كل oSI‏ في حين أن المعاملات السلبية تنطوي على 
عكس ذلك. 
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يُعد الثبات أو الموثوقية قضية أساسية في القياس النفسي. وأهمية الثبات تتضح بمجرد 
فهم olizo‏ بشكل كامل وجيد. وكما يوحي المصطلح» فإن الأداة الموثوقة أو الثابتة هي 
الأداة التي تعمل بطرق متسقة ويمكن التنبؤ بها. ولي يتمتع المقياس LIL‏ يجب أن 
تمثل الدرجات التي تنتج عن استخدامه بعضًا من الحالة الحقيقية للمتغير الذي يجري 
تقييمه وقياسه. ومن الناحية العمليةء يعني هذا ضمنياً أن الدرجة التي تم الحصول عليها 
من استخدام الأداة يجب ألا تتغير ما مم يكن هناك تغيير فعلي في المتغير الذي تقيسه هذه 
الأداةء وبالتالي» يمكن أن يعزى أي تغيير ملحوظ في الدرجات إلى التغيير الفعلي في هذا 
المتغير. ومن GLE‏ وضع مقياس COB‏ تمامًا أن يكون LEI!‏ للدرجة الحقيقية وليس أي 
شيء آخر. ونادراً ما هكن تحقيق SUS‏ ومع ذلك» يمكننا أن نقيس مدى قربنا من هذه 
الحالة المثالية. وكلما كانت الدرجة التي نحصل عليها من مقياس تمثل الدرجة الحقيقية 
للمتغير وكلما كانت تعكس عوامل خارجية أخرى بدرجة منخفضة. كان المقياس الذي لدينا 
أكثر BLS‏ وبشكل أكثر drow)‏ فإن OLS‏ المقياس هو نسبة التباين التي تعزى إلى الدرجة 
الحقيقية للمتغير الكامن. وهناك العديد من الطرق والأساليب لحساب OLY)‏ ولكنها 
تشترك جميعاً في هذا التعريف الأساسي. 

وعلى الرغم من أن الطرق البديلة لحساب GLY!‏ قد تبدو مختلفة:. فإن التعريف 
الأساسي المشترك يتطلب أن تكون متكافئة حسابياً بطريقه أساسيه وهامه. liag‏ هو الحال 
بالفعل. وتنطوي كل هذه الأساليب والطرق على تقدير الدرجة الحقيقية للمتغير وتحديد 
نسبة درجة المقياس التي تم الحصول عليها والتي تمثلها الدرجة الحقيقية. ويقترح نموذج 
القياس الأساسيء والذي تم توضيحه في الفصل الثانيء أن الدرجة الملاحظة تمثل مجموع 
الدرجة الحقيقية للمتغير الذي يجري تقييمه بالإضافة إلى الخطأ الناشئ عن عوامل خارجية. 
وتبعاً لذلك. نستطيع تقدير الدرجة الحقيقية للمتغير عن طريق طرح التباين الناتج 
عن الخطأ من التباين الكلي للدرجة الملاحظة التي تم الحصول عليها من مقياس معين. 
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ويمكننا بعد ذلك حساب GLY)‏ كنسبة للدرجة الحقيقية المقدرة إلى الدرجة الملاحظة. 
وهكذا: 
فإن الدرحة الحقيقية (true score)‏ = الدرجة املاحظة (observed score)‏ - الخطأ (error)‏ 
الثبات = الدرجة الحقيقية / الدرجة الملاحظة 
وتّعد طرق وأساليب تقدير الخطأ هي إلى حد كبير ما هيز المعادلات البديلة لحساب 
الثبات. وقد تم تصميم وتخصيص طرق مختلفة لأنواع محددة من البيانات» على الرغم 
من اشتراكها جميعاً في أساس مفاهيمي مشترك وهو: أن الثبات هو نسبة التباين في الدرجة 
الملاحظة التي هكن أن تعزى إلى الدرجة الحقيقية للمتغير الذي يجري تقييمه. 


الطرق القائمة على تحليل التباين: 

تعتمد إحدى وسائل تقدير الخطأ على تحليل التباين (ANOVA)‏ ويقسم هذا المدخل 
التحلياي للبيانات التباين الكلي الملاحظ إلى مصادر مختلفةء لا سيما تلك التي تكون لها 
أهمية جوهرية (أي إشارة) وتلك التي تنشأ من مصدر خطأ ما (مثل الضوضاء)» مثل الخلل 
أو العيوب في أخذ dus‏ المشاركين من مجتمع ما. وعلى الرغم من أن هذا ليس هو المدخل 
الذي سنركز عليه في تقييم مدى OLS‏ المقاييس والقياس» فإن التطرق إليها بشكل موجز 
يؤكد على الاستمرارية عبر تعريفات ومداخل الثبات. 

ومن ثم» من خلال استعراض ومراجعة dy pu‏ فإن النظر في مجموعة بسيطة للغاية 
من الملاحظات التي تنطوي على درجات حرارة ثمانية أجسام متماثلةء أربعة منها في ضوء 
الشمس المباشر وأربعة منها في الظل (لقد حددت Bae‏ صغيرا من الأجسام الملاحظة 
في هذا المثال من أجل التبسيط). والأجسام متشابهة باستثناء تعرضها لآشعة الشمس؛ 
ومع US‏ فإن مقياس الحرارة ا لمستخدم لقياس درجة حرارتها مشكوك فيه بعض الشيء. 
Why‏ فهو مصدر محتمل للخطأ في درجات الحرارة الملاحظة. ويمكننا تقييم مدى هذا 
الخطأ من خلال تسجيل درجات حرارة كل جسم من هذه الأجسام الثمانية على حدة 
وترتيب المعلومات بعدة طرق. Voi‏ يمكننا تلخيص المعلومات حول الأجسام كمجموعة 
واحدة عن طريق حساب المجموع الكلي wb‏ الانحرافات في درجات حرارة الجسم عن 
المتوسط الكلي لجميع الأجسام. ستكون هذه القيمة هي مجموع المربعات ASI)‏ أو SST‏ 
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ومن خلال تقسيم مجموع المربعات الكلي على درجات الحرية المرتبطة بالعينة بأكملها 
de)‏ سبيل (N-1=8-1=7 Jib‏ سوف نحصل على التباين AI‏ لدرجات حرارة 
الأجسام. والخطوات التالية تعزل المكونات الفرعية لهذا التباين الكلي. ويمكننا ا مضي GS‏ 
في تقدير مدى تأثير الخطأ على هذه الدرجات وبالتالي المكون الفرعي من التباين الكلي. 
في إطار تحليل التباين ANOVA‏ يتم تحقيق ذلك من خلال تقييم مقدار التباين الذي 
يحدث في ظل ظروف مماثلة. في هذه All‏ تتعرض جميع الأجسام ا موجودة في الشمس 
لظروف متماثلة أو متطابقة, وكذلك جميع الأجسام الموجودة في الظل. داخل كل من 
هاتين المجموعتين الفرعيتين» يُفترض أن تكون الأجسام نفسها متطابقة وأن وجود أو عدم 
وجود ضوء الشمس متماثل. لذلك؛ يجب أن يكون الأساس الوحيد للاختلافات في درجات 
الحرارة الملاحظة هو نوع من أنواع الخطأ. وبالتالي» يمكننا دراسة وفحص التباين في درجات 
حرارة الأجسام داخل المجموعات لحساب g garo‏ مربعات الخطأ (SSE)‏ وعن طريق 
طرح مجمع مربعات الخطأ SSE‏ من مجموع المربعات الكلي SST‏ يمكننا حساب مجموع 
المربعات لتأثير ضوء الشمس. liag‏ ا مجموع الأخير هو lal‏ مجموع ال مربعات للدرجات 
الحقيقية. أي إنه مؤشر على مقدار التباين في درجات حرارة الجسم بعد إزالة تأثير خطأ 
القياس. ويمكننا بعد ذلك حساب تباين الدرجة الحقيقية من مجموع ال مربعات هذا. 
Hols‏ من خلال حساب النسبة بين تباين الدرجات الحقيقية والتباين الكلي» نصل إلى 
نسبة التباين الكلي التي يمكن أن تعزى إلى الدرجة الحقيقية (أي تأثير الشمس). وهكننا 
تفسير هذه النسبة على أنها ثبات قياسنا لدرجة حرارة الأجسام. 

لاحظ أنه إذا كانت جميع الأجسام الموجودة في الشمس لها درجات حرارة متماثلة 
وكانت جميع الأجسام الموجودة في الظل لها درجات حرارة متماثلةء يفترض أنها منخفضة, 
فإن تباين الخطأ سيساوي القيمة ”صفر“. Why‏ لن يتم طرح أي شيء من مجموع 
ا مربعات deo SU! SST AII‏ وسيكون تباين الدرجة الحقيقية والتباين AII‏ متساويّين» 
وتكون النسبة التي تمثل ثبات قياس درجة حرارة الجسم تساوي الواحد الصحيح. 

لقد أشرت إلى النسبة الناتجة عن مثال تحليل التباين الموضح أعلاه كمعامل ثبات» وهو 
صحيح. ومع US‏ وبشكل أعم» فإن النسبة التي تقارن التباين الناتج عن بعض المصادر 
المحددة في تصميم تحليل التباين مع التباين الكلي تُعرف باسم معامل الثبات المعياري 
أو معامل الارتباط داخل الطبقة «(intraclass correlation coefficient)‏ أو اختصاراً ICC‏ 
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واعتماداً على نوع وتعقيد تصميم تحليل التباين» بمكن أن يكون هناك أنواع عديدة من 
معامل الارتباط داخل الطبقة والتي ستكون لها تفسيرات مختلفة» وليس كل منها تعادل 
أو تساوي ثبات القياس. على الرغم من أن القراء قد لا يكونون على دراية بمعامل الارتباط 
داخل الطبقة كما هو الحال بالنسبة للتعبيرات أو المصطلحات الأخرى الأكثر شيوعًا OLU‏ 
إلا أننا سنرى أن المنطق الذي تستند dd)‏ المزيد من الممؤشرات الأكثر تخصصاً للثبات يتطابق 
مع منطق معامل الارتباط Jalo‏ الطبقة - وهذا يعني أن كلاً من معامل الارتباط داخل 
الطبقة والطرق الأخرى للحصول على الثبات تستند إلى مقارنة بعض تقديرات تباين الدرجة 
الحقيقية مع التباين الكلي. 


البنود المتصلة «المستمرة» مقابل البنود ثنائية الاستجابة: 

على الرغم من أن البنود قد تكون لها أشكال أو تنسيقات استجابة متنوعة» فإننا نفترض 
في هذا الفصل أن الاستجابات على البند BI‏ من خيارات استجابة متعددة القيمة. 
وتستخدم البنود ثنائية الاستجابة (أي البنود التي لها خياران فقط للاستجابةء مثل «نعم» 
«ng‏ أو تلك التي لديها خيارات استجابة متعددة يمكن تصنيفها على أنها «صحيحة» 
مقابل «خاطئة») على نطاق واسع في اختبار القدرة. وبدرجه أقلء في سياقات قياس أخرى. 
وتتضمن أمثلة البنود ثنائية الاستجابة ما يلي: 
-١‏ زيوريخ هي doole‏ سويسرا. ( ) صحيح ( )خطأ 
-Y‏ ما هي قيمه Spi «gl»‏ 

۱,٤۱) ( 

۳۱١ (ب)‎ 

YVA (g) 

وقد تم تطوير أساليب وطرق dole‏ لحساب GLY‏ والتي تستفيد من بساطة 
العمليات الحسابية للاستجابات ثنائية الخيارات. وتغطي كتب القياس العامة مثل ”نونالي 
وبرنشتاين"“ )1994 (Nunnally and Bernstein,‏ هذه الأساليب والطرق بشيء من 
التفصيل. إن منطق هذه الأساليب لتقييم الثبات Sle‏ إلى حد كبير ا مدخل الأكثر عمومية 
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الذي ينطبق على البنود المتعددة الاستجابة والمقاييس المتصلة أو المستمرة. والواقع إن 
المدخل ach!‏ في تقييم OLS‏ البنود متعددة الاستجابة هو في بعض الحالات امتداد Jeb‏ 
سابق تم وضعه وتطويره ogi‏ ذات الاستجابة الثنائية. وحرصاً على الإيجازء فإن هذا 
الفصل لن يشير إلا بصورة عابرة إلى أساليب تقييم الثبات المعدة للقياسات التي تتكون 
من بنود ذات استجابات ثنائية. وتمت مناقشة بعض خصائص هذا النوع من المقاييس في 
الفصل الخامس. 


الاتساق الداخلي: 

إن OLS‏ الاتساق الداخلي Internal consistency reliability‏ كما يوحي الاسم» يتعلق 
بتجانس البنود داخل المقياس. وتهدف المقاييس القانمة على نماذج القياس الكلاسيكية إلى 
قياس ظاهرة واحدة. كما رأينا في الفصل السابقء تشير نظرية القياس إلى أن العلاقات بين 
البنود ترتبط منطقياً بعلاقات البنود بالمتغير الكامن. وإذا كانت لبنود مقياس ما علاقة 
قوية مع متغيرها الكامن» فستكون لها علاقة قوية مع بعضها البعض. وعلى الرغم من 
Ll‏ لا نستطيع أن نلاحظ مباشرةً العلاقة بين البنود والمتغير الكامنء إلا أنه يمكننا بالتأكيد 
تحديد ما إذا كانت البنود مرتبطة ببعضها البعض. ويكون المقياس متسقًا داخليًا بقدر 
ما تكون بنوده مرتبطة ارتباطاً Whe‏ ببعضها البعض. ما الذي يمكن أن يفسر الارتباط بين 
البنود؟ هناك احتمالان: إما أن تؤثر البنود سببياً على بعضها البعض de)‏ سبيل JELI‏ 
يسبب البند ”أ“ حدوث البند ”ب“)» أو أن البنود تشترك في قضية مشتركة. في معظم 
الحالات» يكون التفسير الأول غير مرجح» مما يجعل التفسير الأخير هو الخيار الأكثر وضوحاً. 
وهكذاء تشير الارتباطات العالية بين البنود وبعضها البعض إلى أن جميع البنود هي المقياس 
asi)‏ إنها مظاهر) لنفس الشيء. إذا وضعنا الافتراضات التي تمت مناقشتها في الفصل 


الارتباطات القوية بين البنود تنطوي على روابط قوية بين البنود والمتغير الكامن. ومن ثم 
يجب أن يتكون المقياس الأحادي البعد أو بعد واحد قياس متعدد الأبعاد من مجموعة 
من البنود التي ترتبط جِيدًا مع بعضها البعض. المقاييس المتعددة الأبعاد التي تقيس 
عدة ظواهر - على سبيل JEL‏ مقاييس موضع أو موقع التحكم أو السيطرة في الصحة 
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(مقاييس موقع الضبط الصحي “(Health Locus of Control scales‏ المتعددة الأبعاد 
(والستونء والستونء وديفيليسء. 1978 (Wallston, Wallston, &DeVellis,‏ - هي 3 


2» 


الواقع تجسد مجموعة من امقاييس المترابطة؛ وكل ”بعد“ هو مقياس بحد ذاته. 


معامل ألفا :Alpha‏ 


الاتساق الداخلي dale‏ ما يتساوى (أو يعادل) مع معامل كرونباخ )۱۹٥۱( Cronbach‏ 
(A) Wi‏ وسوف ندرس معامل ألفا بشيء من التفصيل لعدة أسباب. Vol‏ أنه يستخدم 
على نطاق واسع كمقياس للثبات. وثانياًء قد يكون ارتباطه بتعريف الثبات أقل وضوحاً 
مما هو الحال بالنسبة للمقاييس الأخرى للثبات (مثل أساليب النماذج البديلة) التي تمت 
مناقشتها مؤخراً. وبالتاليء قد يبدو معامل «ألفا» أكثر غموضاً من أساليب حساب الثبات 
الأخرى لأولئك الذين ليسوا على دراية بكيفية alas‏ الداخلي. وأخيراً فإن استكشاف 
المنطق الذي يقوم عليه حساب معامل «ألفا» يوفر أساساً سليماً لمقارنه كيفية استيعاب 
الأساليب الحسابية الأخرى لجوهر ما نعنيه ونقصده بالثبات. 

معادلة كودر - ريتشاردسون (Kuder-Richardson formula 20) ٠‏ أو <KR-20‏ 
كما هو معروف بشكل أكثر شيوعاً - هي نسخة خاصه من معامل ”ألفا“ للبنود ثنائية 
الاستجابة bil)‏ علي سبيل JEL‏ نونالي وبرنشتاين. 1994 (Nunnally & Bernstein,‏ 
ويتساوى كل من معادلة كودر - ريتشاردسون KR-20‏ مع معامل “WP‏ عندما تكون 
البنود المكونة ممقياس هي بنود ثنائية الاستجابة. ومع US‏ وكما ذكر dal‏ سنركز على 
الشكل الأكثر عمومية الذي ينطبق على البنود التي لديها خيارات استجابة متعددة. 

يمكنك التفكير في كل الاختلافات أو التباينات في مجموعه من درجات البنود على أنه 
يحدث بسبب أحد أمرين هما: (I)‏ التباين الفعلي بين الأفراد في الظاهرة التي يقيسها 
)1( يشير موضع الضبط والسيطرة بصفة عامة إلى المدى الذي يمكن من خلاله أن يتحكم الشخص أو يسيطر على الأحداث 

التي تؤثر Ad‏ وهو نوعان: داخلي ومعناه أن الشخص يعتقد بأنه هكن أن يتحكم في حياته» وخارجي أن الشخص 
يعتقد بأن قرارته وحياته يتم التحكم فيها عن طريق الظروف البيئية المحيطة أو عن طريق الصدف. وموضع الضبط 
الصحي مفهوم يشير إلى المدى الذي يُعد الأشخاص أنفسهم وفقه قادرين على التحكم بوضعهم الصحي أو يعتبرون 


أن وضعهم الصحي يتقرر بفعل تحكم الآخرين» أو تقرره عوامل الصدفة بشكل رئيسي (المترجمين). 
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المقياس (أي التباين الحقيقي في المتغير الكامن) أو (ب) الخطأ. وهذا صحيح OV‏ نماذج 
القياس الكلاسيكية تعرف الظاهرة (على سبيل JEB‏ رغبة المرضى في التحكم أو السيطرة 
على التفاعلات مع الطبيب) كمصدر لكافة التباين ا مشتركء ويعرفون الخطأ على أنه أي 
تباين متبقيء أو غير مشترك» في درجات المقياس (على سبيل JEBI‏ بند واحد يكون له معنى 
مزدوج غير المعنى المقصود). وهناك طريقه أخرى للتفكير في هذا الأمر وهو اعتبار أن 
التباين الكلي يشتمل على وجود اثنين من المكونات هما: الإشارة (أي الفروق الحقيقية في 
رغبه المرضى في التحكم والسيطرة) والضوضاء asl)‏ الفروق في الدرجة الناتجة عن كل شيء 
ما عدا الفروق الحقيقية في الرغبة في التحكم أو السيطرة). إن حساب معامل «Lill»‏ كما 
سترى» يقسم التباين الكلي بين مجموعه البنود إلى مكونين هما الإشارة signal‏ والضوضاء 
noise‏ (الخطأ). نسبه التباين الكلي التي تمثل الإشارة تساوي معامل ”ألفا“. وهكذاء هناك 
طريقه أخرى للتفكير في معامل «ألفا» هو أنه يساوي الواحد الصحيح مطروحاً منه تباين 
الخطأ أو. على العكس من US‏ فإن تباين الخطأ يساوي واحداً صحيحاً ناقص معامل ألفا 
(تباين الخطأ - -١‏ معامل ألفا). 


مصفوفة التغاير: 

يساعدنا فحص مصفوفة التغاير covariance matrix‏ لمجموعة من بنود المقياس على 
تحقيق فهم الاتساق الداخلي بشكل كامل. وتكشف مصفوفة التغاير مجموعة من بنود 
المقياس عن معلومات dago‏ حول المقياس JSS‏ 

وتعد مصفوفة التغاير هي شكل أكثر عمومية لمصفوفة الارتباط correlation matrix‏ 
في مصفوفة الارتباط تكون البيانات معيارية gi) standardized‏ معايرة وحدات القياس)» 
مع تحديد التباينات بالواحد الصحيح. وفي مصفوفة التغايرء تكون البيانات المدخلة غير 
معيارية (وحدات القياس الأصلية). وبالتاليء فإنه يحتوي على نفس ال معلومات» كما في 
مصفوفة الارتباط, لكنها في شكل غير معياريء والبنود القطرية (المائلة) لمصفوفة التغاير 
هي التباينات - تباينات البنود مع نفسها - تمامًا مثلما تكون الوحدات الموضوعة على 
طول القطر الرئيسي لمصفوفة الارتباط هي تباينات المتغيرات المعيارية إلى الواحد الصحيح» 
وأيضَا ارتباطاتها مع نفسها. والقيم غير القطرية هي التغايرات covariances‏ والتي 
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تعبر عن العلاقات بين أزواج من المتغيرات غير المعيارية تماماً كما هو الحال في معاملات 
الارتباط المعيارية. وهكذاء من الناحية النظرية. تتكون مصفوفة التغاير من (أ) التباينات 
variances‏ (على القطر) لكل متغير من المتغيرات على due‏ و(ب) التغايرات covariances‏ 
(خارج القطر) التي تمثل العلاقة غير المعيارية بين أزواج المتغيرات. 

Gs‏ الجدول رقم ٠٠١‏ يتم عرض مصفوفة التغاير النموذجية لثلاثة متغيرات هي 
(X39 X29 X1)‏ 


جدول :)١-۳(‏ التباينات والتغايرات BY‏ متغيرات 





ويتم عرض نفس ال مصفوفة بشكل أكثر توافقاً وتجانساً باستخدام الرموز المعتادة 
أو المألوفة للمصفوفات والتباينات والتغايرات على النحو التالي: 
2 
O1 01,2 01‏ 
2 
O2 O73‏ 012 


2 
013 023 O3 


مصفوفات التغاير للمقاييس متعددة البنود: 

دعونا نركز اهتمامنا على خصائص مصفوفة التغاير لمجموعة من البنود التي تشكل» 
عند إضافتها Lili dee‏ تحتوي مصفوفة التغاير الموضحة أعلاه على ثلاثة متغيرات هي 
X39 X29 1‏ افترض أن هذه المتغيرات هي في الواقع درجات BIW‏ بنود وأن هذه 
البنود هي (X39 X29 X1)‏ عند إضافتها leo‏ تشكل مقياسًا سنسميه (ل). ما الذي يمكن 
أن تخبرنا به هذه المصفوفة عن علاقة كل بند من البنود على حدة بالمقياس ككل؟ 
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تحتوي مصفوفات التغاير على عدد من الخصائص Sib!‏ للاهتمام As)‏ الأقلء الجيدة 
وا مفيدة). من بين هذه الخصائص حقيقة أن إضافة كل البنود في المصفوفات Geo‏ (أي 
جمع التباينات» التي تقع على طول Digia häll‏ والتغايرات» التي تقع خارج القطر) 
تعطي قيمة مساوية GL‏ لتباين المقياس SSS‏ بافتراض أن البنود متساوية الأوزان. لذلك؛ 
إذا أضفنا كل البنود إلى مصفوفات التغاير الرمزيةء فسيكون المجموع الناتج هو تباين 
المقياس (Y)‏ هذا مهم للغاية وجدير بالتكرار والذكر: التباين في مقياس (Y)‏ والذي يتكون 
من أي عدد من البنود يساوي مجموع كافة القيم في مصفوفات التغاير الخاصة بهذه البنودء 
بافتراض تساوي وزن البند'. وبالتالي» فإن تباين المقياس (Y)‏ المكون من ثلاثة بنود متساوية 
في الوزن (X39 ×2 9X1)‏ له العلاقة التالية مصفوفات التغاير الخاصة بالبنود. حيث: 


C=| Gs a 8 


القراء الذين يرغبون في الحصول على مزيد من المعلومات حول ال موضوعات التي تم 
تناولها في هذا القتسم مكن إحالتهم إلى نونالي )1978 (Nunnally,‏ من أجل مصفوفات 
التغاير (التباين المشترك) ونامبوديري )1984 (Namboodiri,‏ للحصول على مقدمة في 
مصفوفات الجبر في الإحصاء. تحتوي مصفوفات التغاير لكل بند من البنود على حدة على 
معلومات مفيدة أخرى. وقد ناقشت ”بوهرنستد“ )1969 (Bohrnstedt,‏ التطبيقات التي 
يمكن استخلاصها من مصفوفات التغاير للبند. 
معامل «ألفا» ومصفوفة التغاير: 


تم تعريف معامل WI‏ على أنه نسبة التباين الكلي للمقياس التي يمكن أن تعزى إلى 
مصدر مشتركء ومن المفترض أن تكون الدرجة الحقيقية لمتغير كامن تقوم عليه البنود. 
وبالتالي» إذا basi‏ حساب معامل «ألفا»» فسيكون من المفيد الحصول على قيمة التباين 
الكلي للمقياس وقيمة dod‏ التباين «ا مشترك». مصفوفات التغاير هي فقط ما نحتاج 
إليه من أجل القيام بذلك. 


تطوير المقاييس: النظرية والتطبيق vo‏ 


الفصل الثالث 


تذكر المخطط البياني الذي استخدمناه في الفصل الثاني لتوضيح كيفية ارتباط البنود 
بالمتغير الكامن الخاص بهاء كما في الشكل رقم .)١-۳(‏ 

جميع الاختلافات في البنود الناتجة عن المتغير الكامن (Y)‏ هي مشتكة أو شائعة. 
(وتُستخدم مصطلحات المشتركة joint‏ والشائعة communal‏ أيضًا لوصف هذا الاختلاف). 
عندما يختلف المتغير لا (كما هو الحال» على سبيل المثالء بين الأفراد الذين لديهم مستويات 
مختلفة من السمة التي مثلها)» ستختلف الدرجات على كافة البنود معه BY‏ سبب تلك 
dojo Cals (SIG! GLa ull‏ ا ded yo‏ وف أكون كل رات الييوة 
مرتفعة؛ وإذا كانت درجة (Y)‏ منخفضة. فإن درجات البنود تميل إلى أن تكون منخفضة, 
وهذا يعني أن البنود سوف تميل إلى التغيير بشكل مشترك gl)‏ تكون مترابطة مع بعضها 
البتعض). لذلك يؤثر المتغير الكامن على BE‏ البنودء وبالتالي فإن البنود تكون مرتبطة 
ببعضها البعض. وعلى النقيض من US‏ فإن متغير الخطأ هو مصدر الاختلاف الفريد الذي 
يمتلكه كل بند. في حين أن كل البنود تشترك في التباين بسبب (Y)‏ فلا يوجد بندان اثنان 
يشتركان في أي تغيير من مصدر الخطأ نفسه في ظل افتراضات القياس الكلاسيكية الخاصة 
Ly‏ تؤثر قيمة متغير خطأ معين على درجة بند واحد فقط. hg‏ لا ترتبط متغيرات 
الخطأ ببعضها البعض. ولذلك؛ فإن كل بند (وضمنيًاء المقياس الذي يحدده مجموع البنود) 
يتغير كدالة ل (I)‏ مصدر التباين TR aL‏ بينه وبين البنود الأخرىء و(ب) التباين الفريد 
وغير المشترك الذي نشير إليه على أنه ths‏ ويترتب على ذلك أن التباين الكلي لكل بند - 
وبالتالي» بالنسبة للمقياس ككل - يجب أن يكون Buje‏ من التباين من المصادر المشتركة 
والمصادر الفريدة. ووفقًا لتعريف الثبات» يجب أن تساوي قيمة معامل ألفا نسبة التباين 
في المصدر المشترك إلى التباين الكلي. 





شكل )1-7( مخطط هثل كيفية ارتباط مجموعة مكونة من خمسة بنود بالمتغير الكامن المشترك (Y)‏ 
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الثبات (الموثوقية) 


الآنء ضع في اعتبارك مقياساً من عدد (k)‏ بند يسمى لآ الذي تكون مصفوفة التغاير له 
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التباين (OF)‏ للمقياس المكون من عدد (k)‏ بند يساوي مجموع جميع polis‏ المصفوفة. 
المدخلات على طول القطر الرئيسي هي تباينات البنود الفردية الممثلة في المصفوفة. (ويُشار 
إلى تباين البند ”1“ ك 07( لذلك؛ فإن مجموع البنود على طول القطر الرئيسي )2107( 
هو مجموع التباينات لكل بند من البنود على حدة. وبالتاليء فإن مصفوفة التغاير تتيح 
L‏ وصولاً Myo‏ إلى قيمتين هما: )١(‏ التباين الكلي للمقياس (OP)‏ والذي يُعرف على أنه 
مجموع US‏ البنود في ا لمصفوفة و(؟) مجموع التباينات لكل بند من البنود على حدة 
)207( المحسوبة من جمع القيم على طول القطر الرئيسي. وهاتان القيمتان هكن 
إعطاؤهما hut‏ مفاهيمياً أو نظرياً. فمجموع المصفوفة بأكملهاء بحكم التعريف. هو 
تباين المتغير (Y)‏ للمقياس المكون من مجموعة بنود. ومع US‏ فإن هذا التباين ANII‏ 
مكن تقسيمه» كما قلناء إلى أجزاء مختلفة. 

دعنا ننظر في كيفية فصل مصفوفة التغاير RAL‏ عن التباين الفريد من خلال دراسة 
كيفية اختلاف البنود الموجودة في häll‏ الرئيسي لمصفوفة التغاير عن كافة البنود غير 
القطرية gi)‏ تقع خارج القطر). كل التباينات (البنود القطرية) هي متغير مفرد أو ”متغير 
مع نفسه“. وقد لاحظنا في وقت سابق أن هذه التباينات هكن اعتبارها بمثابة تغايرات في 
البنود مع نفسها. ويحتوي كل تباين على معلومات حول بندٍ واحدٍ فقط. وبعبارة أخرى, 
ig‏ كل منها معلومات تستند إلى بند واحد» وليس إلى التباين ا مرتبط المشترك بين البنود. 


تطوير المقاييس: النظرية والتطبيق vw‏ 


الفصل الثالث 


(وفي إطار هذا البند الواحده سيكون جزء من تباينه ناتجاً عن اممتغير الأماسي المشترك 
Why‏ سيتم dowlis‏ مع بنود أخرى؛ وبعضها لن يكون EUIS‏ ومع US‏ فإن تباين البند 
لا يحدد مقدار التباين ا مشترك ولكن فقط يحدد مقدار التشتت في الدرجات الخاصة بهذا 
البندء بغض النظر عن الأسباب). وتتضمن العناصر غير القطرية لمصفوفة التغاير أزواجاً من 
البنود» Why‏ التباين الشائع gf)‏ المشترك) بين بندين من بنود المقياس (التغاير). وبالتالي» 
فإن العناصر الموجودة في مصفوفة التغاير (وبالتالي التباين الكلي للمتغير (Y‏ تتكون من 
التغاير (التباين ARAL!‏ إذا صح التعبير) بالإضافة إلى التباين ”غير المرتبط“ أو ”غير المشترك“ 
بشأن البنود التي يتم النظر فيها بشكل فردي. هثل الشكل رقم (Y-Y)‏ هذين التقسيمين 
الفرعيين لمصفوفة التغاير. وال منطقة المظللة على طول القطر هي الجزء غير المشترك من 
المصفوفة. والمنطقتان غير القطريتين داخل الحدود المثلثية foe‏ الجزء المشترك. 








شكل (-؟) مصفوفة التباين - التغاير تبين أن التباين على طول القطر الرئيسي هو التباين غير 
Rall‏ في حين أن التغايرات الموجودة فوق القطر أو أسفله هي تباينات مشتركة 


Les‏ أن التغايرات - والتغايرات فقط - تمثل التباين المشتركء فإنه يجب أن تكون كل 
التباينات غير المشتركة ممثلة في التباينات على امتداد القطر الرئيسي لمصفوفة التغايرء 
وبالتاليء يمكن التعبير عنها بالمصطلح )?210( وبالطبع: يتم التعبير عن التباين الكلي 
ب (S$)‏ أي مجموع كافة عناصر المصفوفة. وبالتاليء يمكننا التعبير عن نسبة التباين غير 
ا مشترك إلى التباين الكلي في المتغير (Y)‏ على النحو التالي: 
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الثبات (الموثوقية) 


وتتطابق هذه النسبة مع مجموع القيم القطرية في مصفوفة التغاير. وبالتالي» يمكننا 
أن نعبر عن نسبة التباين المرتبط أو tbl‏ وما يتبقى منها - وبعبارة أخرىء تكملة هذه 
القيمة كما هو مبين كالتالي: 
)02 / ?20( -1 


وتتوافق هذه القيمة مع مجموع كافة القيم غير القطرية لمصفوفة التغاير. قد يبدو 
غريباً أو على الأقل غير Sled‏ حساب العناصر القطرية ثم طرحها من قيمة مصفوفة التغاير 
JSS‏ اذا لا نعسب فقط مجموع العناصر غير القطرية بشكل مباشر (2Oi,j) Jis‏ 
حيث إن (1) و(ز) يمثلان كل بند من البندين المتضمنين في تغاير معين؟ Go‏ الواقع. يمكن 
للمرء أن يصل إلى نفس النقطة بالضبط عن طريق الحساب المباشر ممجموع العناصر غير 
القطرية. إن الصيغة أو المعادلة التي تتضمن الطرح من الواحد الصحيح هي إرث من 
الأيام التي لم تكن فيها أجهزة الحاسب JYI‏ متوفرة لإجراء العمليات الحسابية. 

حساب التباين USI‏ للمتغير (Y)‏ والتباين لكل pais‏ على حدة Ley (i)‏ كانت عمليات 
تم تنفيذها بالفعل لأغراض أخرى. وحتى لو لمم تكن هناك dele‏ لحساب هذه التباينات 
لأغراض أخرىء فانظر إلى الجهد الحسابي الذي تنطوي عليه. فبالنسبة للمقياس المكون 
من ۲۰ dan‏ سيكون الاختيار بين حساب Yy‏ تبايناً (واحد لكل بند والآخر للمقياس (USS‏ 
مقابل 11١‏ تغاير gi)‏ واحد لكل عنصر من العناصر غير القطرية البالغ عددها ۲۸۰ عنصاً 
في المصفوفة» مع تلك العناصر التي تكون فوق قطر المصفوفة المتماثلة لتلك التي أدناه) 
بالإضافة إلى التباين الكلي. ومن ثم» فإن الصيغة أو المعادلة التي تحدد التباين المشترك 
على أنه ما تبقى بعد إزالة التباين غير المشترك من التباين AII‏ تكون معادلة أكثر منطقية 
مما قد تبدو عليه في البداية. 

القيمة التي تمثلها المعادلة هي: 

)?0 / ?20( -1 
«gl‏ أي ما Joles‏ أو يكافئ: 


2 
20 / OF 
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الفصل الثالث 


من النظرة أو الوهلة الأولى قد يبدو أن ذلك يعكس تعريف معامل WÍ‏ (أي الجزء 
ا مشترك من التباين الكلي في مقياس يمكن أن يعزى إلى المصدر اممشترك للبنودء والذي نفترض 
أنه يعكس الدرجة الحقيقية للمتغير الكامن). بيد أننا ما زلنا بحاجة إلى تصحيح إضافي. 
وتصبح هذه doled!‏ واضحة إذا أخذنا في الاعتبار ما سيحدث إذا كان لديناء على سبيل 
JGL‏ خمسة ogi)‏ مترابطة GL‏ مثل هذا الترتيب ينبغي أن يؤدي إلى الثبات التام. إن 
مصفوفة الارتباط. كما ذكر dail‏ هي مجرد مصفوفة تغاير حيث تم فيها معايرة «توحيد 
قياس» كل البنود. ونظرًا لأن البنود الموجودة في مصفوفة الارتباط أكثر ألفة واتساقًا (أي 
أن الارتباط eld!‏ يتطابق دائًا مع معامل الارتباط الذي تكون قيمته الواحد الصحيح). 
سأستخدم مصفوفة الارتباط لتوضيح هذه النقطة. إذا استخدمنا التعبيرات المذكورة أعلاه 
لتمثيل جزء من التباين المشترك والتباين الكلي في مصفوفة الارتباط الافتراضية الخاصة بها 
والمكونة من خمسة بنود لها OLS‏ تام» فما الذي يمكن الحصول Sade‏ تتكون مصفوفة 
الارتباط في هذه الحالة من مصفوفة من النوع )0 (0X‏ وكل القيم تساوي الواحد الصحيح. 
ومقام المعادلة السابقة» الذي هثل التباين الكلي للمقياس الذي Bly‏ من البنود الخمسة, 
يساوي YO‏ ومع US‏ فإن البسط Y‏ يساوي ٠١ Gow‏ فقطء مما يسفر عن ثبات مقداره 
يساوي (Aa) 70/7٠١‏ بدلاً من الواحد الصحيح. لماذا يحدث هذا؟ العدد الإجمالي 
للعناصر في مصفوفة التغاير هو (k?)‏ وعدد العناصر في المصفوفة التي تكون غير مشتركة 
(على سبيل JELI‏ العناصر الموجودة على امتداد القطر الرئيسي) هو (K)‏ والرقم المشترك 
JS)‏ العناصر غير القطرية) هو k)‏ - 2). وهكذاء فإن الكسر الموجود في المعادلة الأخيرة 
لدينا يحتوي على hw‏ يستند إلى قيم (k? - k)‏ والمقام يستند إلى قيم (K2)‏ ولضبط 
أو تعديل حساباتنا بحيث تعبر النسبة عن الأهمية النسبية بدلاً من عدد البنود المجمعة 
في البسط والمقام, فإننا نقوم بضرب المعادلة بأكملها التي تمثل نسبة التباين المشترك في 
القيم المقابلة للفروق في عدد البنود التي تم تجميعها. وللقيام Ms‏ نضرب المعادلة في 
المقدار k2 / (k2 - k)‏ أو. ما k / (k - 1) «ggl‏ وهذا الإجراء يقيد مدى أو نطاق 
القيم المحتملة لمعامل ألفا لتكون ما بين الصفر والواحد الصحيح. في المثال المكون من 
خمسة بنود الذي تمت مناقشته cg‏ يؤدي ضرب (A+)‏ في )0 / (E‏ إلى الحصول على 
القيمة واحد صحيح وهي قيمة الثبات التام. قد يرغب القراء في إجراء الحساب الذهني 
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الثبات (الموثوقية) 
للمصفوفات ذات الأحجام الأخرى. ينبغي أن يصبح واضحًا أن المقدار (1 k/ (k=‏ هي 


Glo‏ المضاعف (المضروب فيه) الذي سينتج dic‏ قيمة معامل ألفا مساوية لواحد صحيح 
عندما يكون الارتباط بين البنود وبعضها البعض تاماً. وهكذاء نصل إلى الصيغة أو المعادلة 


المعتادة لمعامل ألفا وهي: 
zai‏ 1 ا 595 
k-1 o‘‏ 


y 





وخلاصة gill‏ إن ثبات المقياس يساوي نسبة التباين الكلي بين بنوده التي تُعزى إلى 
المتغير الكامن وبالتالي فهي مشتركة. وتعبر صيغة أو معادلة معامل ألفا عن ذلك لتحديد 
الجزء من التباين الكلي لمجموعة البنود الفريدة» مع طرح هذا من الواحد الصحيح لتحديد 
النسبة اممشتركةء والضرب في doleo‏ تصحيح لضبط وتعديل عدد العناصر المساهمة في 
الحسابات السابقة. 


dso‏ أو معادلة بديلة لمعامل «ألفا»: 

هناك معادلة شائعة أخرى لحساب معامل ألفا تعتمد على الارتباطات بدلاً من 
التغايرات (التباينات المشتركة). في الواقع» إن هذه المعادلة تستخدم متوسط الارتباط بين 
البنود (7 ). هذه المعادلة هي: 

kr‏ ع 
1+(k-1)r‏ 

وتتبع هذه المعادلة منطقياً للمعادلة القائمة على التغاير معامل LWT‏ تأمل أو خذ بعين 

الاعتبار معادلة التغاير من حيث المصطلحات امفاهيمية: 


مجموع تباينات البند 1 
مجموع التباينات والتغايرات ai‏ 
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الفصل الثالث 


لاحظ أن البسط والمقام في الحد على اليمين هما عبارة عن مجموع القيم لكل بند. 
ومع ذلك فإن مجموع هذه القيم الفردية يكون مماثلاً لمتوسط القيم مضروباً في عدد 
القيم المعنية. (على سبيل JEL‏ أرقام (k)‏ التي يساوي مجموعها00 (k)9‏ ضعف متوسط 
هذه الأرقام تساوي 00 أيضاً. ولمزيد من التوضيح» بالتعويض عن k‏ بالقيمة ٠١‏ في الإجراء 
السابق؛ يجب أن يكون متوسط ٠١‏ قيم يصل مجموعها إلى 0٠‏ هو خمسة Glad]‏ القيمة 
عشرة أو عشرة أضعاف القيمة خمسة» وهي نفس القيمة في المجموع الأصلي). لذلك؛ 
يجب أن يساوي البسط الخاص بالحد على اليمين (k)‏ مضروباً في متوسط تباين البند (V)‏ 
ويجب أن يساوي المقام (K)‏ مضروباً في متوسط التباين زائد (K2 - K)‏ - أو Ias‏ من US‏ 
(k) (k - 1)‏ - مضروباً في متوسط التغاير ( € ): 


_ k (1 ko 
نور‎ T - عجو‎ 


لإزالة الواحد الصحيح من Molebl‏ يمكننا استبدالها ما يعادلهاء / © [kV +(k) (K-1)‏ 
[kV +(k)(k-1) © [‏ مما يسمح W‏ بدمج الحد على اليمين بأكمله في نسبة واحدة: 


k (ko+(k—-1)¢—ko 
k—1 


a= 2‏ 
ko +(k)\(k—Ne‏ 
أي ما يعادل أو يكافئ: 
k k(k—1)é‏ 
CS. sl are FERRET‏ 
k—-1\ kl o0+(k-1)¢é]‏ 
يؤدي الحذف المتبادل للمقدار (K)‏ من البسط الخاص بالحد الأيسر ومقام الحد الأهنء 


بينما يؤدي الحذف المتبادل للمقدار )1 - (k‏ من البسط الخاص بالحد الأيمن ومقام الحد 
الأيسر إلى الحصول على الشكل المبسط التالي للمعادلة: 
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الثبات (الموثوقية) 


ke 
v+(k—l1)e 
من‎ Vay تنطوي على ارتباطات‎ lade أن الصيغة أو المعادلة التي نسعى للحصول‎ Siig 
من متغيرات غير معيارية. بعد المعايرةء يكون‎ Vay التغايرات» وبالتالي متغيرات معيارية‎ 
متوسط التغايرات مطابقاً لمتوسط الارتباطات ويساوي التباين الواحد الصحيح. وبالتالي»‎ 
مع الواحد الصحيح. وينتج‎ (F) مكننا استبدال متوسط الارتباط بين البنود وبعضها البعض‎ 
على الارتباط لمعامل ألفا:‎ LEW! عن ذلك الصيغة أو المعادلة‎ 
kr 
= 
1+ (k —-1)F 





C= 


وتعرف هذه الصيغة أو امعادلة باسم معادلة تنبؤٌ سبيرمان - براون ‘Spearman -Brown‏ 
وسيتم توضيح أحد استخداماتها ا مهمة في قسم من هذا الفصل الذي يتناول حساب الثبات 
بطريقة التجزئة النصفية. وتحسباً لهذه المناقشة. لاحظ أن المعادلة تقدم الثبات كدالة 
لخاصيتين من خصائص اممقياس هما: عدد البنود في المقياس (k)‏ ومتوسط الارتباط بين 
أزواج البنود Lbs (F)‏ كلما olj‏ عدد البنود التي يحتويها المقياس وكان متوسط 
الارتباط بين تلك البنود أقوىء زاد الثبات. 


ويشار أحيانًا إلى الصيغتين المختلفتين» التي تستند إحداهما على التغايرات وتستند 
الأخرى على الارتباطات» على أنهما معادلات وصيغ الدرجة الخام والدرجة المعيارية 
ممعامل ألفاء على الترتيب. وتحافظ معادلة الدرجة الخام على المعلومات حول متوسطات 
وتباينات البند في عملية الحساب OY‏ التباينات المشتركة (التغاير) تستند إلى القيم التي 
تحتفظ بوحدات القياس الأصلية للبيانات الخام. إذا كانت للبنود تباينات مختلفة بشكل 
ملحوظء فإن تلك البنود التي لها تباينات أكبر سيكون لها وزن أكبر من تلك البنود التي لها 
تباينات أقل عند استخدام هذه المعادلة لحساب معامل ألفا. ولا تحتفظ ال معادلة المعيارية 
أو القياسية القائمة على الارتباطات بوحدات القياس الأصلية للبنود. تذكر أن الارتباط 
هو تغاير معياري أو قياسي. لذلك يتم وضع جميع البنود على مقياس مشترك. وبالتاليء 
تكون الأوزان متساوية في حساب معامل ألفا من خلال المعادلة المعيارية. أيهما أفضل 
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أن يتم الاعتماد على السياق المحدد أم الوزن المتساوي؟ وكما سنرى في الفصول اللاحقة, 
فإن الإجراءات الموصى بها لتطوير البنود le WE‏ تستلزم هيكلة صياغتها بحيث تسفر عن 
تباينات مماثلة لكل بند. وعندما يتم اتباع هذه الإجراءات» يكون هناك dole‏ اختلاف 
بسيط في معاملات ألفا المحسوبة بواسطة الطريقتين البديلتين. ومن dol‏ أخرىء عندما 
لايتم اتباع الإجراءات الرامية إلى إحداث تباينات متكافئة في ogl‏ يلاحظ أن قيم WÍ‏ 
المعيارية والخام تختلف اختلاقًا Dus‏ (على سبيل SEM‏ (0,00) أو أكثر) يدل على وجود بند 
واحد على الأقل له تباين يختلف Kus Bus!‏ عن التباينات في البنود الأخرى. 


نقد معامل «ألفا»: 


يمكن للمرء أن يجادل بأن معامل ألفاكرونباخ ليس مؤشراً مثالياً للثبات (على سبيل 
اممثال» سيجتزما 2009 (Sijtsma,‏ وف الواقع» فإنه - أي معامل ألفاكرونباخ - dole‏ ما يوفر 
الحد الأدنى لتقدير الثبات lower bound‏ الحقيقي de garb‏ من البنود Jus‏ من أفضل 
تقدير للثبات الحقيقي. ويشير «سيجتزما» )۲٠٠۹(‏ إلى أن مفهوم الاتساق الداخلي غامض 
إلى حد ما ويثير تساؤلاً حول مدى تمثيل معامل ألفا لأهم جوانب الاتساق الداخلي. ويشير 
إلى أن الاتساق الداخلي يتعلق بالبنية العاملية لمجموعه من البنود وأن اعتبار معامل ألفا 
مؤشراً على ذلك هو إفراط في التبسيط. بامعني الدقيق أو الضيق» OB‏ رأي «سيجتزما» 
صحيح. غير أنه يعترف بوجود مشاكل في التقديرات الأخرى (على سبيل SEL‏ تقدير الحد 
الأدنى المنخفض (greatest-lower-bound estimate of reliability, or glb LAU‏ التي 
يمكن اعتبارها بديلاً عن معامل ألفا. ويقترح «سيجتزما». بشكل مثير ومناسبء كسبيل إلى 
المزيد من الدقةء ينبغي القيام بمزيد من العمل من أجل الفهم الكامل لأنواع التحيز التي 
قد تكون موجودة في مختلف مؤشرات الثبات. 

هناك نقد آخر لمعامل ألفا كمعامل للثبات يتمثل في أنه تم تصميمه بشكل أساسي للبيانات 
المستمرة أو المتصلة. وتعتمد الحسابات التي تنطوي عليها عملية تحديد معامل ألفا على 
ارتباطات بيرسون Pearson‏ التي تفترض القياس اممساف أو الفتري interval scaling‏ ويلاحظ 
JS‏ من ”جادرمان» وجوهن» (Gadermann, Guhn, and Zumbo, 2012) “gogig‏ أن 
أنواع الاستجابات أو الردود على البنود كثيراً ما نُستخدم في العلوم الاجتماعية وف lane‏ 
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هيء على وجه ABU‏ من نوع القياس الترتيبي وليست من نوع القياس المسافي أو الفتري. 
وكمثالء خذ بعين الاعتبار البند الافتراضي التالي (وخيارات الاستجابة المصاحبة له) والذي 
يقصد به أن يكون جزءاً من مقياس الشك الذاتي: 


لم أتمكن من إنجاز وتحقيق كل ما كنت أتمنى أن أفعله. 





من الواضح أن الفئات مرتبة من الأقل اتفاقاً إلى الأكثر اتفاقاً مع البندء ولكننا لا نستطيع 
أن نفترض أن الزيادة في الشك الذاتي التي بمثلها الفرق بين اختيار الاستجابة )1( بدلاً من 
الاستجابة (Y)‏ هو نفس مقدار الزيادة في الشك الذاتي عند اختيار الاستجابة (V)‏ بدلاً من 
الاستجابة (0). asi‏ إنه لا يمكننا أن نفترض زيادات المسافات بالتساوي ف المتغير الذي 
يستنبطه البند. فالفئات مجرد فئات ترتيبية بالمعني الدقيق للكلمة. وقد أشار «جادرمان 
وآخرون» )2012 (Gadermann et al.,‏ إلى أن هذه المسافات غير المتساوية تؤدي إلى عدم 
الدقة في استخدام معامل ألفا كتقدير GLY‏ الاتساق الداخلي وأوصوا ببديل آخرء أطلقوا 
عليه معامل ألفا الترتيبي ordinal alpha coefficient‏ والذي لا يفترض القياس الفتري 
أو المسافي. ويستبدل مدخلهم أو طريقتهم هذه استخدام ارتباطات بيرسون بالارتباطات 
الرباعية tetrachoric‏ أو متعددة الأقسام polychoric‏ (الأولى في الحالات التي تنطوي على 
الاستجابات الثنائية للبندء والأخيرة في الحالات التي تنطوي على خيارات استجابة ترتيبية 
متعددة النقاط). وتفترض الارتباطات الرباعية / متعددة الأقسام أن المتغير قيد الدراسة 
هو متغير مستمر أو متصل لکن يتم قياسه بشكل ترتيبي» باستخدام فئتين أو أكثر مرتبة 
كخيارات استجابة. ومن الناحية dy BU‏ هكن للمرء أن يفكر في حدود السمة المقاسة 
(الشك الذاتي في هذا المثال) الموجودة على طول سلسلة متصلة. عند مستوى ما من السمةء 
هناك to‏ عندما يتم تجاوزه» يميل المجيب لاختيار LS‏ الاستجابة (V)‏ بدلاً من الخيار .)١(‏ 
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توجد حدود إضافية (عند مسافات غير محددة) بين كل خيار استجابة والبديل الأعلى التالي. إن 
الارتباط متعدد الأقسام بين أي بندين من النوع الذي تم وصفه سابقًا يبين أساساً مدى ميل هذه 
الانتقالات والتحولات عبر هذه الحدود إلى الحدوث بشكل مرتبط بدلاً من أن تحدث بشكل 
مستقل بالنسبة للبنود المعنية. هذا الارتباط هو تقدير الاحتمال الأقصى للارتباط الحقيقي 
بين المتغيرات الترتيبية (تيمرمانء ولورينزو 2011 (Timmermann & Lorenzo-Seva,‏ 
باستبدال مصفوفة ارتباطات بيرسون بمصفوفة الارتباطات متعددة الأقسام» يمكن للمرء 
الحصول على معامل ألفا الترتيبي بدلاً من معامل ألفا المعياري. 
وقام «غادرمان وآخرون» )2012 (Gadermann et al.,‏ ببحث تأثير استبدال 
ارتباطات بيرسون بالارتباطات الرباعية / متعددة الأقسام في دراسة تتضمن بيانات محاكاة 
simulated data‏ أظهرت نتائج دراسة المحاكاة هذه أن معامل ألفا يظهر تحيرًا أكبر 
(أي انخفاض التقديرات لأقصى درجة للثبات المعروف للجموعة البنود ال معينة) مقارنة 
بمعامل ألفا الترتيبي. إن الالتواء الشديد في توزيع الدرجات يضر على وجه الخصوص بدقة 
التقديرات الناتجةعن معامل ألفاكرونباخ» وفقًا للمحاكاة التي أوردها «غادرمان وآخرون» 
ومع EUS‏ تجدر الإشارة إلى أن الارتباطات متعددة الأقسام تنطوي على قيود خاصة بهاء 
لا سيما مع أحجام العينات الصغيرة )2011 (Timmermann & Lorenzo-Seva,‏ 
انتقد مؤلفون آخرون معامل ألفا لأسباب أخرى غير تحيزها Lewis‏ يكون قياس البند من 
النوع الترتيبي وليس من النوع الفتري أو المسافي. على سبيل JELI‏ لاحظ كل من «ديونء 
باجوليء وبرينسدن» )404 (Dunn, Baguley, and Brunsden, 2014: p.‏ ما يلي: 
الصعوبات الرئيسة في استخدام معامل ألفا كمقياس للاتساق الداخلي يمكن تلخيصها 
على النحو التالي: 
-١‏ يعتمد معامل ألفا على افتراضات بالكاد يمكن أن تتحقق (أي يصعب تحقيقها). 
-Y‏ يؤدي انتهاك هذه الافتراضات إلى تضخيم معامل LAT‏ وتقليل تقديرات الاتساق الداخلي 
للمقياس. 
WI -Y‏ إذا تم حذف بند“ [طريقة dole‏ لتقييم تأثير كل بند من البنود على حدة على معامل 
ألفا الكلي] في dys‏ لا يعكس تأثير Gio‏ البند على ثبات المجتمع الإحصائي population‏ 
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-E‏ لا يعكس التقدير بنقطة لمعامل ألفا التباين الموجود في عملية التقديرء مما يوفر ثقة 

زائفة في اتساق إدارة وتطبيق مقياس ما. 

سأتناول WS‏ من هذه الانتقادات تباعاً واحدة بعد الأخرى. تتطلب افتراضات نموذج 
«تاو» المتماثل أو المترادف في الأساس التي يقوم عليها معامل ألفا أن تكون كل البنود 
مؤشرات جيدة بنفس القدر لمفهوم بنائي واحد يشتركون فيه. أي dl‏ يجب أن يقوم أي 
بند بمهمة جيدة في التأثير على السمة التي يتم قياسها مثل أي بند آخر. وبشكل أكثر 
رسمية. يحدد هذا الافتراض أن مجموعة البنود تكون أحادية البعد olg‏ التغايرات بين 
البنود والدرجة الحقيقية للمتغير الكامن متساويان أساساً. على الرغم من أن تباينات 
الخطأ (وبالتالي التباينات الملاحظة للبنود) Y‏ يلزم أن تكون UIS‏ ويمكن أن يحدث انتهاك 
أو مخالفة الافتراض الخاص بأحادية البعد إذا كان محتوى البنود ينطوي على أكثر من 
مفهوم واحد متميز تشترك فيه البنود. على سبيل JEL!‏ قد يؤدي استخدام Slo}‏ تهدف 
إلى قياس القلق إلى قياس جوانب الاكتئاب عن غير قصد. وإذا لم يتم إدراك وتحديد 
هذه الازدواجية المفاهيمية, فإن ذلك قد يشكل انتهاكًا لافتراض أحادية البعد الذي يقوم 
عليه استخدام معامل ألفا. وبطبيعة led!‏ فإن افتراض أحادية البعد هو Las)‏ افتراض 
معظم البدائل المقترحة ممعامل ألفاء وبالتاليء فإن انتهاك افتراض أحادية البعد يطرح مشكلة 
أكثر عمومية في تقدير الثبات. وهناك نوع أكثر شيوعًا من انتهاك نموذج «تاو» المتماثل 
أو المترادف في الأساس هو وجود بنود لا تعبر عن المتغير الأساسي بنفس القدر من الصحة, 
أي أن لها Gil plas‏ مختلقة مح الدرجة الحقيقية.. وسيتضح ذلك ق فكل ازتباطات مقبادلة 
غير متجانسة بين البنود. لأن كل التباين المشترك بين بندين في مجموعة بنود أحادية 
البعد. هو مظهر من مظاهر ارتباط كل بند بالدرجة الحقيقية. وإذا كانت بعض البنود 
ارتباطها أقل قوة بتلك الدرجة الحقيقية من غيرهاء فإن الارتباطات بين البنود التي تنطوي 
على تلك البنود ستكون أقل. لذلك؛ بالنسبة لأربعة polis‏ افتراضية هي A‏ و8 و0 Dg‏ 
لها تغايرات خاصة بكل منها مع الدرجات الحقيقية هي ١",٠و١‏ ٠ر١‏ ولالا,٠‏ و00 فإن 
الارتباطات بين A‏ و8 و0 (TBC9 rAC9 ۲۸8 gl)‏ بشكل عام ستكون أعلى (وأكثر (Glis‏ 
من الارتباطات التي تتضمن Dal‏ (أي rAD‏ و8 .(rCD9‏ سيكون عدم تجانس تباین 
البنود بمثابة Wo‏ مهم على انتهاك افتراض نموذج ”تاو“ المتماثل أو المترادف في الأساس 
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sf)‏ مقارنات التغايرات من البند إلى الدرجة الحقيقية). كما أن البنود التي لها خيارات 
استجابة مختلفة. مثل خيار مكون من (E)‏ نقاط Yard‏ البنود وخيار مكون من (V)‏ نقاط 
للبنود الأخرىء LYS‏ ما تؤدي LÍ‏ إلى انتهاك افتراض SE‏ تغايرات البند والدرجة الحقيقية. 
اذا هو كذلك؟ وحتى عندما يكون هناك شخصان لهما نفس الدرجة الدقيقة من السمة 
التي يجري تقييمهاء فإن التطابق بين درجاتها على بندين لا هكن أن تكون تامة إلا عندما 
يكون عدد خيارات الاستجابة متطابقًا لكلا البندين. وبشكل ele‏ فإن عدم تطابق عدد 
خيارات الاستجابة بين بندين سيسفر عن انخفاض درجة ارتباطهما des‏ مقارنة بأداء نفس 
البنود عندما يكون لكل منهما نفس العدد من خيارات الاستجابة. لذلك؛ ستؤدي خيارات 
الاستجابة غير المتطابقة إلى بعض أزواج البنود (تلك التي لها نفس عدد خيارات الاستجابة) 
التي من المحتمل أن يكون لها ارتباطات أقوى مع أزواج بنود أخرى (حيث لا يتطابق عدد 
خيارات الاستجابة). وها أن الارتباطات بين البنود وبعضها البعض متأصلة في ارتباطات 
البنود بالدرجة الحقيقيةء فإن هذه الارتباطات المتباينة بين البنود وبعضها البعض تعني 
ضمنياً أن التغايرات بين البنود والدرجة الحقيقة تكون مختلفة Las)‏ عبر البنود. هذل 
بطبيعة lod!‏ يشكل انتهاكًا لنموذج «تاو» المتماثل أو المترادف في الأساس والذي يستند 
إليه معامل ألفا. ونتيجة لانتهاك هذا الافتراض المحدد, فإن معامل ألفا قد لا يقدم Da‏ 
Lids‏ للثبات الحقيقي للمقياس. وهكذاء يجادل دان وآخرون )2014 ob (Dunn et al.,‏ 
استمرار استخدام ألفا يطرح gl)‏ يسبب) مشكلة. 

أما حجتهم الثانية هي أن الفشل في تلبية تلك الافتراضات والوفاء بها ليست مجرد 
مسألة نظرية بل هي أيضاً نتيجة عمليه. أي إن أنواع الثبات تقدر التباينات التي ينتجها 
معامل Wi‏ كبيرة ها فيه الكفاية. على الرغم من أن US‏ من المغالاة في التقديرات والتقليل 
من التقديرات هما أمران ممكنان عندما تفشل مجموعه البنود في الوفاء بافتراضات 
نموذج «gin‏ المتماثل أو المترادف ف الأساس. فإن التقدير المنخفض هو الأكثر شيوعاً HS‏ 
لأن معامل ألفا هو تقدير الحد الأدنى للثبات في إطار نموذج «تاو» المتماثل أو المترادف 
في الأساس. ومع HIS‏ يمكن أن يحدث التضخم عندما يكون عدد البنود التي تشكل 
المقياس كبيراً جداً OV)‏ القيمة التي تم الحصول عليها لمعامل ألفا تميل إلى الزيادة مع عدد 
البنود). أما الظروف التي تنطوي على أكبر التناقضات بين مستويات ألفا الاسمية والثبات 
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الحقيقي هي تلك التي تشكل انتهاكات صارخة للافتراضات المتعلقة لنموذج «تاو» المتماثل 
أو المترادف في الأساس. وقد تم وصف بعض هذه الحالات في وقت سابق عند «غادرمان 
وآخرين» )2012 .(Gadermann et al.,‏ 

أيضَاء انتقد «glo»‏ وآخرون )2014 (Dunn et al.,‏ الممارسة الخاصة بحذف البنود 
بالتتابع واحدًا تلو الآخرء ثم النظر في SWI‏ على معامل ألفا كوسيلة لاكتشاف أفضل السبل 
لتحسين الاختصار للمقياس وثباته (موضوع سأناقشه بمزيد من التفصيل في فصل لاحق). 
وتؤكد الحجة التي طرحوها على أن حذف بند معين قد يزيد معامل ألفا لمجموعة متنوعة 
من الأسباب» وبالتالي قد لا تمثل زيادة في تغاير الدرجة الحقيقية للبند JSS‏ ويقترحون أن 
الأساس المنطقي لحذف بند ما يستند على افتراض أن جميع البنود لها تباينات Lad‏ متساوية 
(وهي خاصية أو سمة من سمات البنود التي تفي أو تلبي افتراضات الاختبارات المتوازية 
أو المتكافئة ولكن ليست Lobel‏ للاختبارات الخاصة لنموذج ”تاو“ المتماثل أو المترادف في 
الأساس» على النحو ال لمشار إليه في الفصل الثاني). ولكن هذا لا يفترض في معظم تطبيقات 
Jles‏ ألفا. Weg‏ يكون الافتراض هو لنموذج «تاو» المتماثل أو المترادف في Lud‏ 
والذي Y‏ يتطلب تباينات خطأ متساوية. Why‏ قد لا يكون للبند المحذوف تباين درجة 
حقيقية أكبر. ولكن هلك تباين خطأ أقل فقط عند استخدامه في هذه الحالة المحددة sÍ)‏ 
مع العينة التي تم جمع البيانات منها). ومن المفترض أن التقلبات أو التغيرات في تباين 
الخطأ تعتمد بشكل أكبر على العينة» في yo‏ أن التغاير في الدرجة الحقيقية أكثر صلة 
بتقدير مدى ثبات المقياس في المجتمع الإحصائي. ومن ثم, فإن الحجة. تذهب إلى القول 
بأن التحسن الظاهر في الثبات الذي تحقق عن طريق إسقاط أو حذف البنود التي لا تعزز 
معامل ألفا قد يكون مجرد وهم أو خداع. 

ويستند انتقادهم Glu!‏ لمعامل ألفا على فكرة أن تقدير قيمة وحيدة للثبات ليست 
ذا مغزى محدد ما م يكن لدينا بعض الفهم والإدراك مدى التشتت الكبير Jib‏ هذه 
التقديرات. أي إنه بدون فترة ثقة حول تقدير الثبات الذي يوفره معامل ألفاء فإنه يكون 
من الصعب قياس مقدار الثقة التي ينبغي أن تكون لدينا في ذلك التقدير. 
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معالجة محددات وقيود معامل «ألفا»: 


إحدى وسائل التغلب على هذا الانتقاد الأخير هي تحديد فترة ثقة لمعامل ألفا. وهذا 
يسمح للباحث ob‏ يتأكد أنه ضمن هامش خطأ محدد مسبقًا (على سبيل Sb)‏ الثقة 
بنسبة 290( يقع الثبات الحقيقي للمقياس بين قيمتين محددتين. لذلك؛ على سبيل SEL)‏ 
إذا كانت قيمة معامل ألفا تبلغ ٠,۸0‏ (تقدير النقطة للثبات) لها فترة ثقة 10 X‏ يحدها 
GB Vege >‏ ذلك يشير إلى أن احتمال أن يقع OLY!‏ الحقيقي داخل تلك الحدود كان 
بنسبة 10 % واحتمال أن يكون خارج تلك الحدود كان بنسبة KO‏ 


الطريقة التي أوصى بها lo»‏ وآخرون» )2014 (Dunn et al.,‏ وغيرهم ds)‏ سبيل 
امثال. باديلاء وديفرزء ونيوتون 2013 (Padilla, Divers, & Newton,‏ لتحديد فترات الثقة 
لتقدير الثبات المعين الذي يتضمن تقنية!" .bootstrapping‏ ولتوضيح تقنية بوتسترابنج 
bootstrapping‏ أقوم أولاً بمراجعة كيفية إنشاء فترة ثقة بدون بوتسترابنج. وعادةً ما 
يتطلب مفهوم 373 الثقة» كما ينطبق هناء استخدام مجموعات بيانات متعددة من أجل 
الحصول على توزيع قيم dalek‏ المجتمع parameter‏ التي يتم تقديرها. لذلك؛ على سبيل 
JUL!‏ إذا baf‏ فترة ثقة حول تقدير نقطة b woth‏ طول للأشخاص في مدينة معينةء فيمكننا 
سحب أو أخذ العديد من عينات الأشخاص من تلك المدينة» وحساب متوسط الطول لكل 
digs‏ وإنشاء توزيع لهذه المتوسمطات. ويكون المتوسط الكبير (أي القيمة المتوسطة لتوزيع 
متوسطات العينة) هو تقديرنا لنقطة المتوسط الحقيقي لطول الأشخاص في المدينة. ونتوقع 
حدوث اختلافات في متوسط الأطوال الملاحظة من عينة إلى أخرى بشكل عشوائي OY‏ 
جميع العينات مأخوذة من نفس المجتمع. وبالتاليء ينبغي أن يكون توزيع المتوسطات 
ممتوسط الطول توزيعاً طبيعيًا (خاصةً إذا قمنا بسحب أو أخذ sus‏ كاف من العينات). 


(Y)‏ بوتستراب (Bootstrap)‏ هي تقنية لإعادة المعاينة والتي هي حالة خاصة من أساليب المحاكاة بطريقة مونت كارلو 
وذلك للحصول على مقدرات أكثر دقة عندما يكون حجم العينة صغيراً أو تعذر تحديد التوزيع الاحتمالي للمقدر 
محل الاهتمام. والفكرة الأساسية لهذه التقنية تتضمن القيام بتوليد عدد كبير من العينات المسحوبة مع الإرجاع 
من بيانات العينة الأصلية. LUIS‏ فهذه الطريقة تزودنا بالخطأ المعياري للمقدرات بدون أن يتطلب ذلك حسابات 
نظريةء وهذا يوفر الوقت والجهد (اللترجمّين). 
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وكما هو Jll‏ مع أي توزيعات طبيعيةء يمكننا تحديد الحدود التي كانت بالنسبة ل 780 
المركزية من متوسط الأطوال» مع تحديد قيم العينات المقابلة للحدود الدنيا والعليا لهذه 
ا منطقة. لذلك؛ إذا كان المتوسط الكلي (على سبيل SU‏ متوسط كل متوسطات العينات 
الفردية) هو dog) TA‏ فيمكننا إيجاد الحدود العليا والدنيا لفترة الثقة البالغة 190 حول 
pai‏ هذه النقطة. وتتبع بوتسترابنج Bootstrapping‏ نفس المنطق مع اختلاف مهم للغاية. 
فبدلاً من أخذ عينات متعددة من المجتمع, فإنه يحاي هذه العملية من خلال أخذ عينات 
فرعية متعددة من عينة واحدة متوفرة. وفي الأساس» يتم التعامل مع العينة التي تكون 
في متناول اليد كمجتمع ويتم االسحب مع الإرجاع replacement‏ لعدد كبير من “Olas”‏ 
مختلفة منها. بهذه الطريقةء يتم إنشاء إصدارات أو نسخ مختلفة من العينة ويمكن حساب 
معامل WI‏ في كل منهاء مما يؤدي إلى توزيع درجات معامل ألفا التي هكن أن تكون ilie‏ 
أساس لتحديد فترات الثقة. 

وتقدم Wob‏ وآخرون )2013 (Padilla et al.,‏ وصفاً مفصلاً لطريقة بوتسترابنج لحساب 
فترات الثقة لمعامل ألفا باستخدام بيانات المحاكاة. وكوسيلة لفهم فائدة طريقة بوتسترابنج» 
يمكن أن تكون بيانات المحاكاة مفيدة بشكل خاص GY‏ مجموعة البيانات هكن إنشاؤها مع 
الثبات «الحقيقي» للمقياس الافتراضي المحدد مسبقاً من قبل الباحثين. ويمكن تحديد قيمة 
درجة حقيقية تعسفية كما يمكن توليد بيانات «ملاحظة» تختلف عن الدرجة الحقيقية بطرق 
تخضع تماماً لسيطرة أو ضبط الباحثين. وبالتالي» يمكن للباحثين التحكم في كل من مدى ثبات 
ا مقياس الافتراضي من البداية وخصائص التوزيع (مثل الالتواء والتفلطح) لمجموعة بيانات 
المحاكاة. وبعد WS‏ يمكن للباحثين Las‏ طرق مختلفة للبوتسترابنج وتحديد أيهم يوفر 
تمثيلاً أكثر دقة للقيم «الحقيقية» التي قاموا ببنائها من بيانات المحاكاة. واستخدمت «باديلا 
وآخرون» )7١١(‏ هذا المدخل ääk‏ طرق مختلفة لتقدير فترات الثقة لمعامل ألفا تحت 
ظروف بيانات مختلفة (على سبيل JEL!‏ بيانات ذات توزيع غير طبيعي). وتشير نتائجها إلى 
أن بعض الطرق تعمل بشكل جيد عبر مجموعه متنوعة من الظروفء في حين أن بعض الطرق 
الأخرى تعتمد بدرجه أكبر على شروط توزيعية معينه للتأكد من دقتها. وبشكل أعم» OB‏ 
النتائج التي توصلوا إليهاء استناداً إلى عمليات المحاكاة. توفر رؤى تفصيليه عن الوقت الذي 
يمكن فيه تطبيق مدخل البوتسترابنج لإيجاد فترات الثقة لمعامل ألفا كتقدير Gab‏ الثبات. 
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تتمثل أحد الجوانب السلبية المحتملة لاستخدام المحاكاة في أنه من السهل وغالبًا ما 
يكون من المغري محاكاة خصائص التوزيع المتطرفة التي تنتج اختلافات كبيرة بين المعلمات 
المقدرة والمعلمات النظرية مثل الثبات. على الرغم من أن أهمية أسلوب ال محاكاة, إلا أن 
أكثر ما يهتم به الباحثون هو خصائص بياناتهم الفعلية. لحسن الحظء يمكن Las)‏ استخدام 
مدخل البوتسترابنج bootstrapping‏ مع البيانات الفعلية لتحديد فترات الثقة حول قيمة 
معامل ألفا التي تم الحصول عليها. م يتم استخدام Bootstrapping‏ على نطاق واسع 
بهذه الطريقة في الماضيء ويرجع ذلك جزئيًا إلى أن الأدوات الحسابية لإنشاء نماذج فرعية 
من bootstrap‏ ولحساب فترات الثقة م تكن متوفرة بسهولة. ولقد تغير هذا إلى حد ما 
مع ظهور برنامج التحليل الإحصائي (Venables, Smith, & the R-Core team, 2015) R‏ 
وهي din‏ برمجية قوية ومتعددة الاستخدامات تمكن المستخدمين من de game slol‏ واسعة 
من عمليات التحليل والرسومات البيانية. وبرنامج التحليل الإحصانئي R‏ مجاني ويمكن 
الوصول إليه من خلال الرابط -http://www.r-project.org: JW!‏ هذا الموقع يوفر أيضاً 
الوثائق. وداخل بيئة البرنامج الإحصائي R‏ يوجد عدد من الحزم المتاحة والتي هي في 
الأساس مجموعات من البرامج الفرعية المصممة حول تحقيق أهداف تحليلية أو رسومية 
محددة. وهذه أيضًا متاحة مجانًا ويمكن الوصول إليها من مواقع نسخ متطابقة متعددة 
من داخل dig‏ البرنامج الإحصان R‏ 


على الرغم من أنه من الواضح إمكانية تعزيز فائدة معامل ألفا باستخدام الارتباطات 
الرباعية /المتعددة الأقسام أو عن طريق تحديد فترات AAI‏ يوصي العديد من المتخصصين 
في منهجية البحوث بمدخل بديل يعالج محددات أو قيود معامل ألفا بشكل كامل. هذا 
العلاج أو الوسيلة تتمثل في معامل أوميغا (CD)‏ وهو تقدير بديل للثبات. ومنطق معامل 
أوميغا مشابه لمنطق معامل ألفا. وكلاهما يعرفان الثبات أساساً على أنه نسبة تباين الدرجة 
الحقيقيةء مقارنة بالتباين الكلي الملاحظ. ومع US‏ يستخدم معامل أوميغا طريقه مختلفة 
لحساب التباين ذي الصلة. في حين يشتق معامل ألفا تقديرات التباين من مصفوفة التغاير 
(أو الارتباط) للبنود التي تشكل مقياساً فإن معامل أوميغا يستخدم مصفوفة من تشعبات 


ay‏ تطوير المقاييس: النظرية والتطبيق 


الثبات (الموثوقية) 


البنود على عامل مشترك وحيد تشترك فيه البنود. وستتم مناقشة التحليل العاملي بشكل 
أكثر شمولاً في فصل لاحقء ولكن في الوقت الراهن: يمكننا أن نؤكد أن أحد استخداماته 
هو تقدير الارتباط بين كل مجموعه من dgidl‏ من diol‏ وعامل هشل المتغير الأساسي 
المشترك login‏ من ناحية أخرى. وهذه الارتباطات هي تشبعات البنود على العامل. 
ويستند معامل أوميغا على افتراضات النموذج المتقارب أو التقاربي congeneric‏ (الذي 
تمت مناقشته بإيجاز في الفصل الثاني) بدلاً من افتراضات نموذج «gb»‏ المتماثل أو المترادف 
في الأساس التي يعتمد عليها معامل ألفا. والاختلاف الرئيسي بين الافتراضات بالنسبة 
للنموذجين هو أن النموذج التقاربي Y‏ يتطلب أن تكون التغايرات للبنود مع عاملها المشترك 
(الوكيل لتحقيق الدرجة الحقيقية) متساوية أساساً. وكل ما هو مطلوب فعلاً هو أن كل 
البنود تعكس متغيراً أساسياً مشتركاً واحداً يؤدي إلى عامل مشترك واحد فقط. 

ومن dol!‏ النظريةء فإن استخدام معامل أوميغا يعد أمراً جذاباً للغاية. فهو يعتمد 
على نفس منطق معامل ألفاء أي تقسيم التباين الملاحظ إلى جزء يعكس الدرجة الحقيقية 
والباقي يعكس الخطأ. ومن ثم» OB‏ النسبة الكلية (أي تباين الدرجة الحقيقية زائد تباين 
الخطآ) التي تعزى إلى الدرجة الحقيقية ستقدر الثبات. ولكنه يفعل ذلك دون قيود 
ومحددات افتراض gògail‏ «تاو» المتماثل أو المترادف في الأساس. ولا يزال افتراض أحادية 
البعد sl)‏ إن جميع البنود تعكس متغيراً lelg Guu‏ مشتركًا) Glas‏ ولكن تم إهمال 
والتخلي عن القيد الإضاف والمتمثل في أن تكون التغايرات بين البنود والدرجة الحقيقية 
(والتي تقارب تحميلات أو تشعبات البنود على العامل) متساوية بشكل أساسي. 

وعلى الرغم من هذه المزايا النظرية» فإنه مم يتم اعتماد معامل أوميغا على نطاق واسع 
بسبب التعقيد الكبير في طريقة حسابه. على عكس معامل ألفاء والذي يمكن حسابه 
باستخدام قلم رصاص وورق بمجرد حساب بعض الإحصائيات الأساسية (مثل تباينات البنود 
والتباين الكلي للمقياس)» أما استخدام معامل أوميغا فإنه ينطوي على زيادة ous‏ الأرقام 
بشكل كبير. bg‏ تكن الإجراءات الروتينية AEI‏ لحساب معامل أوميغا متوفرة على نطاق 
guls‏ في حزم برامج إحصائية شائعةء ولكن هذا يتغير الآن. 

مرة أخرىء يقدم البرنامج الإحصائي Uo R‏ مجانياً ويمكن الحصول عليها بسهوله للمعضلة 
الحسابية. على الرغم من أن Jase des ghol‏ للإجراء التحلياي في البرنامج الإحصائي R‏ 
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هو خارج نطاق هذا الكتاب. فإن ”بيترز“ )2014 (Peters,‏ يصف كيفية إعداد البرنامج 
الإحصاني R‏ بحيث تكون هناك dole‏ فقط لكتابة سطرين من التعليمات البرمجية code‏ 
لحساب كل من معامل ألفا ومعامل أوميغاء كاملة مع حساب فترات للثقة لكل منها. وهذا 
يسمح للباحث ليس فقط الحصول على معامل أوميغا ولكن أن يقارنه مع معامل ألفا. 
وبالنسبة لأولئك الذين يفضلون نظرة أكثر تفصيلاً إلى حد ما لعمليات البرنامج الإحصائي R‏ 
والذين قد يحتاجون إلى بعض التوجيه فيما يتعلق باستيراد ملف بيانات من مصادر مثل إكسل 
أو برنامج SPSS‏ إلى البرنامج الإحصائي R‏ فقد وصف دان وآخرون )2014 (Dunn et al.,‏ 
وصفاً جزئياً عملية آلية مبسطة لحوسبة معامل أوميغا مع فترات الثقة. ومن الجدير بالذكر 
أن مدخل البوتسترابنج المستخدمة في هذه الحسابات يتضمن إنشاء ما يصل إلى ٠٠٠١‏ 
عينة فرعيه من مجموعه البيانات الأصلية وأداء الحسابات على كل عينة من هذه العينات 
الفرعية. وهكذاء فإن العملية برمتها سوف تستغرق Wg‏ أطول بكثير حتى تكتمل وتنتهي 
من الحساب البسيط لمعامل Wi‏ باستخدام الحزم الإحصائية القياسية. والوقت الذي ينطوي 
عليه الأمر هو دليل على حقيقة أن هذه الإجراءات أصبحت متاحه على نطاق واسع فقط 
مع ظهور أجهزة الحاسب الآلي Gling‏ البرمجيات المتقدمة مثل البرنامج الإحصائي R‏ 


COL رأييء فإن معامل ألفا يحتفظ بالفائدة والمنفعة. وهو كتقدير للحد الأدنى‎ ds 
فإنه يعد تقديراً متحفظاً للثبات. وعلاوة على ذلك عندما يتم توخي الحذر في وضع واختيار‎ 
البنود وأن تكون متوافقة مع افتراض أحادية البعد ونموذج «تاو» المتماثل أو المترادف في‎ 
Jelas الأساس» فإن العديد من المخاطر المحتملة لاستخدام معامل ألفا كمؤشر على الثبات‎ 
كرونباخ على نطاق واسع» واستندت معايير الباحثين‎ WI تم استخدام معامل‎ ol أو تقل.‎ 
حول متى تكون أدوات القياس ثابته بدرجة كافية إلى حد كبير على استخدام معامل ألفا.‎ 
مستوى معين‎ GV وإذا كان معامل ألفا متحفظًا بعض الشيء في بعض الحالات» ثم بالنسبة‎ 
من الثبات» فإن بعض المؤشرات البديلة قد تنتج عنها قيمة رقمية أعلى من قيمة معامل ألفا.‎ 
doe أي مقياس معين تحت شروط وظروف معينة سيكون له ثبات‎ Kya قد يكون هذا‎ 
ولا تغير طريقة تقدير ذلك الثبات التي تسفر عن قيمة رقمية أكبر من ثبات المقياس. إذا‎ 
وقيمة لمعامل أوميغا‎ ٠,۸١ لمعامل ألفا تساوي‎ dad حقق مقياس معين في مناسبة معينة‎ 
المقياس م يتغير نتيجة للحساب الأخير باستخدام معامل أوميغا.‎ OLS فإن‎ AY بقيمة‎ 
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صحيح أن قيمة معامل أوميغا قد تكون أكثر دقة من الناحية الرقميةء لكن هذا لا يعني أن 
OLS‏ المقياس قد تغير, بل إن المقياس المستخدم لقياس هذا الثبات قد تغير. وبعبارة أخرى, 
فإن القيمة العددية الأعلى البالغة oleh + AY‏ أوميغاء في هذه الحالة الافتراضية, تعادل 
أساسًا (أي أنها تمثل نفس درجة الثبات) القيمة ٠,۸١‏ لمعامل ألفا. ومن ثم فإن اعتماد وتبني 
معيار جديد لتمثيل الات يتطلب إعادة معايرة معاييرنا الحالية القائمة على أساس معامل 
ألفاء وهذا لن يكون as Daas‏ بسيطً؛ لا مكن للمرء أن يحول بين تقدير الحد الأدنى glb‏ 
أو قيمة معامل أوميغا ومعامل ألفا ببساطة بمجرد الإضافة أو الضرب في مقدار ثابت. (في 
الفصل التالي» أناقش حججًا مماثلة ضد تصحيح الارتباطات الضعيفة عند دراسة (Stall‏ 
ولأن معامل أوميغا سيكون أكثر دقة (على سبيل Sb!‏ إذا كان التفكير في معامل الثبات من 
حيث نسبة التباين في المقياس المشترك مع الدرجة الحقيقية). فسيكون من الطفيد في نهاية 
المطاف التعود على المقياس الجديد. ومع استمرار العمل على بدائل مختلفة لمعامل ألفاء قد 
نصل قريبًا إلى وقت يتم فيه تبرير مزايا هذه البدائل باعتمادها على نطاق أوسع. ومع ذلك 
من المهم في غضون ذلك إدراك أن القيم العددية الأعلى لمعامل أوميغا بالنسبة إلى معامل 
Wi‏ لنفس البيانات الناتجة عن نفس المقياس هي dole]‏ معايرة وليست زيادة في الثبات. 


الثبات القائم على الارتباطات بين درجات المقياس: 

هناك بدائل لمعامل ألفا كمؤشر على الثبات. قد تتضمن هذه الأنواع من حساب الثبات 
وجود نفس مجموعة الأشخاص الذين يكملون نسختين منفصلتين من مقياس أو نفس 
النسخة من المقياس في مناسبات متعددة. 
ثبات النماذج البديلة: 

إذا كان هناك شكلان متماثلان بشكل تام للمقياس» يمكن حينئذ حساب الارتباط بينهما 
طاما أن نفس الأشخاص يكملون الاستجابة على كلا الشكلين المتماثلين. على سبيل JEBI‏ 
افترض أن الباحث قام Voi‏ بتطوير مجموعتين متماثلتين من البنود التي تقيس رغبة المرضى 
في التحكم عند التفاعل مع الأطباء. ثم eb‏ بإدارة وتطبيق مجموعتي البنود لمجموعة واحدة 
من <g2 yb}‏ ثم hel‏ قام بحساب الارتباط بين درجات مجموعة واحدة من البنود مع 


تطوير المقاييس: النظرية والتطبيق 10 


الفصل الثالث 


درجات مجموعة البنود الأخرى. فإن هذا الارتباط سيكون هو ثبات النماذج البديلة. تذكر 
أن النماذج المتكافئة أو المتوازية تتكون من بنود, كلها (إما داخل النماذج أو بينها) تؤدي 
عملاً جيداً بنفس القدر لقياس المتغير الكامن. وهذا يعني أن كلا الشكلين من المقياس لهما 
معاملات LA]‏ ومتوسطات dulu‏ وتباينات متماثلة. ويقيسان نفس الظاهرة. وتتكون 
النماذج ABIL)‏ في جوهرهاء من مجموعة واحدة من البنود التي تم تقسيمها بطريقة 
عشوائية إلى مجموعتين فرعيتين تشكلان النموذجين المتماثلين والبديلين للمقياس. في Jb‏ 
هذه الظروف» يكون الارتباط بين أحد النماذج والنموذج الآخر GK‏ أو مساوياً لارتباط 
أي من النموذجين مع نفسه. حيث إن كل نموذج هو بديل مكافن للآخر. 


ols‏ التجزئة النصفية: 

تتمثل مشكلة النماذج البديلة للثبات في أننا Bole‏ لا نملك نسختين من المقياس تتوافقان 
LA‏ مع افتراضات الاختبارات المتكافئة أو المتوازية. ومع AUS‏ هناك تقديرات أخرى 
للثبات تطبق نفس النوع من المنطق على مجموعة واحدة من البنود. ونظرًا OY‏ النماذج 
البديلة تتكون Lill‏ من مجموعة واحدة من البنود التي تم تقسيمها إلى قسمينء فإنه 
يترتب على ذلك أنه يمكننا (أ) أخذ مجموعة البنود التي تشكل مقياسًا واحدًا Gl)‏ مقياس 
لا يحتوي على أي نموذج بديل)» و(ب) تقسيم مجموعة البنود هذه إلى مجموعتين فرعيتينء 
و(ج) إيجاد الارتباط بين المجموعات الفرعية لتقييم الثبات. 

ويُسمى مقياس الثبات من هذا النوع باسم DLS‏ التجزئة النصفية .Split- half reliability‏ 
ويُعد ثبات التجزئة النصفية في الواقع class Laub‏ وليست نوعاً واحداً من الطرق الحسابية 
نظراً لوجود مجموعة متنوعة من الطرق التي يمكن بها تقسيم المقياس إلى نصفين. وتتمثل 
إحدى الطرق في مقارنة النصف الأول من البنود بالنصف الثاني. قد Lig‏ هذا النوع من 
تقسيم المقياس إلى نصفين هما نصف ol‏ ونصف أخير إشكالية» OV‏ عوامل أخرى غير قيمة 
المتغير الكامن (بمعنى آخرء مصادر الخطأ) قد تؤثر على كل مجموعة فرعية بشكل مختلف. 
على سبيل SALI‏ إذا كانت البنود المكونة للمقياس المحدد منتشرة ومتناثرة خلال استبيان 
ghee‏ فقد يكون المجيبون أكثر G‏ أو Bla‏ عند إكمال النصف الثاني من المقياس. وعندئذء 
سيختلف الإرهاق أو التعب بشكل منتظم بين النصفينء مما يجعلهما أقل تشابهاً على ما يبدو. 
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ومع ذلك» فإن عدم التماثل أو LEVI‏ لن يكون سمة من سمات البنود في حد ذاتها بقدر 
ماهي موضعها في ترتيب البند من المقياس. ومن العوامل الأخرى التي قد تحدث الفرق 
او الاختلاف بين البنود في النصف الأول والبنود في Gall‏ الأخيرء تأثير الممارسة (حيث قد 
تتحسن إجابة المستجيبين على agil‏ أثناء سيرهم في عملية الإجابة)» أو الإخفاق والفشل 
في إكمال مجموعه البنود بأكملهاء أو Ley‏ حتى شيء gole‏ مثل التغييرات في جودة طباعة 
الاستبيان من الأمام إلى الخلف. وكما هو الحال بالنسبة لحالة التعب أو الإجهاد. فإن هذه 
العوامل ستخفض الارتباط بين النصفين بسبب الترتيب الذي عرضت به بنود المقياس وليس 
بسبب نوعيه أو جودة بنود Läb‏ ونتيجة ode Jio dolga‏ فإن قياس قوة العلاقات بين 
البنود قد يكون معقداً بسبب عدم اتصال الظروف مباشرةً بجودة البندء مما يؤدي إلى تقييم 
SLU‏ بصوره خاطئة. 

ولتجنب بعض المخاطر المرتبطة بترتيب did!‏ يمكن للمرء أن يقيم نوعاً آخر من ثبات 
التجزئة النصفية ا معروفة بثبات البنود الفردية والزوجية .odd-even reliability‏ في هذه 
الحالة» تتم مقارنه المجموعة الفرعية من البنود IS‏ الترقيم الفردي بالبنود ذات الترقيم 
الزوجي. وهذا يضمن أن IS‏ من المجموعتين الفرعيتين من البنود تتكون من عدد متساو 
من كل قسم (أي بداية ومنتصف ونهاية) من المقياس الأصلي. على افتراض أن ترتيب البند 
غير ذي صلة As)‏ عكس الترتيب «السهل إلى الصعب» الشائعة في اختبارات التحصيلء على 
سبيل ال مثال)ء فإن هذا الأسلوب يتجنب العديد من المشاكل المرتبطة بتقسيمات النصف 
الأول مقابل النصف الثاني. 


ومن الناحية النظريةء هناك العديد من الطرق الأخرى للوصول إلى الثبات بطريقة 
التجزئة النصفية. هناك بديلان للطرق التي تمت مناقشتها أعلاه لتكوين مجموعات البنود 
الفرعية هما النصفان المتوازنان balanced halves‏ والنصفان العشوائيان random halves‏ 
في الحالة الأولى» هكن للمرء أن يحدد بعض خصائص أو Glow‏ البند التي يحتمل أن تكون 
مهمة (مثلء الصياغة في حد ذاتهاء أو طول البندء أو ما إذا كان نوع معين من الاستجابة 
يشير إلى وجود أو GLE‏ السمة المعنية). ثم يتم تشكيل نصفي المقياس بحيث تكون 
الخصائص ممثلة بالتساوي في كل نصف. وهكذاء هكن للباحث أن يقسم البنود بحيث 
يكون لكل مجموعة فرعية نفس عدد البنود التي تمت صياغتها في القسم أو ال مجموعة 
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الأولى ونفس ous‏ العناصر القصيرة وما إلى ذلك. غير أنه عند النظر في خصائص البنود 
المتعددةء قد يكون من اللمستحيل تحقيق التوازن بين نسبة بند دون أن يكون التوازن بين 
بند وبند آخر أمراً مستحيلاً. وهذا هو الحال» على سبيل SEL‏ إذا كانت هناك بنود في 
القسم أو النصف الأول أكثر من البنود القصيرة. ومن شأن إيجاد توازن لهذه الخاصية 
الأخيرة أن يستلزم اختلال التوازن في الخاصية الأولى أو السابقة. أيضًاء قد يكون من الصعب 
تحديد خصائص البنود التي ينبغي موازنتها. 

يمكن أن يحصل الباحث على نصفين عشوائيين بمجرد التوزيع العشوائي لكل بند من 
البنود على إحدى المجموعتين الفرعيتين اللتين سيتم في النهاية حساب الارتباط مع بعضهما 
البعض لحساب تقدير الثبات. ويتوقف مدى نجاح هذا العمل على عدد البنود وعدد 
الخصائص موضع الاهتمام» ودرجة الاستقلال بين الخصائص. على آمل أن يسفر عدد قليل 
من البنود» التي تختلف وفقًا لعدة أبعاد مترابطة» عن مجموعات قابلة للمقارنة من خلال 
التوزيع العشوائي» وهذا pol‏ غير واقعي. ومن ناحية أخرىء فإن التوزيع العشوائي لمجموعة 
مكونة من +0 Ían‏ تتفاوت وتختلف فيما يتعلق بسمتين أو ثلاث سمات غير مترابطة إلى 
فئتين قد يؤدي إلى مجموعات فرعية قابلة للمقارنة فيما بينها بشكل معقول. 

وتعتمد Jai]‏ طريقة يتم بها الحصول على نصفين مجزأين على الموقف أو الحالة 
الخاصة بها. وأهم ما في الأمر هو أن يفكر الباحث في طريقة تقسيم البنود التي يمكن 
أن تؤدي إلى مجموعات فرعية غير متكافئة والخطوات التي يمكن اتخاذها لتجنب ذلك. 
إن التبرير المنطقي وراء كل من ثبات التجزئة النصفية وثبات النماذج البديلة هو امتداد 
طبيعي لنموذج الاختبارات المتكافئة (المتوازية). 

les‏ الرغم من أننا عندما ناقشنا هذا النموذج في البداية» اعتبرنا أن كل بند هو اختبارء 
يمكن للمرء أن ينظر أيضاً إلى مقياس (أو نصفين من مقياس) يتوافق مع النموذج كاختبار. 
IVs‏ يمكننا تطبيق ال منطق الذي استخدمناه في حاله البنود المتعددة على حالة اثنين 
من النماذج البديلة أو نصفين من المقياس. فكر في اختبارين (نصفي اللقياس أو النماذج 
البديلة) تحت افتراضات الاختبارات المتكافئة» كما هو موضح في الشكل رقم (Y-F)‏ 

والسبيل الوحيد الذي يربط بين الممكونين الاثنين للمقياس هو ال مسارات السببية من 
المتغير الكامن إلى كل hai‏ من نصفي المقياس. وهكذاء فإن ناتج قيم هذه المسارات 
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يساوي الارتباط بين الاختبارات. وإذا كانت قيم المسار لابد أن تكون متساوية (وهي تكون 
كذلك تحت افتراضات هذا النموذج)» فإن الارتباط بين الاختبارات يساوي مربع قيمة 
امسار من المتغير الكامن إلى أي من الاختبارين. مربع ذلك المسار (على افتراض أنه معامل 
مسار معياري) هو أيضاً نسبة التباين في أي اختبار يتأثر بالمتغير الكامن. وهذا بدوره هو 
تعريف الثبات. Why‏ فإن الارتباط بين الاختبارين يساوي ثبات كل منهما. 





شكل (*-): مخطط مسار يوضح علاقات نصفي hb)‏ منفصلين (X2)9 (X1)‏ بالمتغير الكامن المشترك بينهما 


وفي حين أن الاختبارات (LAL‏ إليها في الفقرة السابقة هي عبارة عن نسختين كاملتين 
من ال مقياس في حالة النماذج البديلةء إلا أنهما عبارة عن نصفين للمقاييس في حالة التجزئة 
النصفية. وبالتاليء فإن الارتباط بين نصفي المقياس يؤدي إلى تقدير الثبات لكل نصف من 
ا مجموعة الكاملة من ogil‏ وهو ما يقلل من تقدير ثبات مجموعة البنود بأكملها. ويمكن 
حساب تقدير OLS‏ المقياس بأكمله» استنادًا إلى ثبات جزء من المقياسء باستخدام معادلة 
سبيرمان براون <Spearman-Brown formula‏ التي تمت مناقشتها سابقًا ف هذا الفصل. 
Sis‏ أنه lds‏ لهذه ال معادلةء فإن معامل LY!‏ ألفا يساوي: 

kr 


Qi = 
1+ )2- 12 





حيث k‏ هي عدد البنود المعنية وهو متوسط ارتباط بين بند ما مع أي بند آخر asl)‏ 
متوسط الارتباط بين البنود). إذا كنت قد حددت مدى ثبات مجموعة فرعية من البنود 
(على سبيل Stihl‏ من خلال طريقة التجزئة النصفية) وتعرف عدد البنود التي يستند إليها 
الثبات (على سبيل Sb!‏ نصف العدد في المقياس بأكمله). فيمكنك استخدام ال معادلة 
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لحساب متوسط ارتباط بين بند ما مع أي بند آخر. بعد HS‏ يمكنك بمساعدة قيمة 
هذه وعدد العناصر في المقياس بأكملها لتعويض في المعادلة. وستكون النتيجة تقديراً 
OLY‏ المقياس بالكاملء استناداً إلى قيمة الثبات المحسوبة لنصفي المقياس المجزأ. وهذا 
يعمل على تبسيط الأمور SI‏ قمت بإجراء بعض العمليات الجبرية (الحسابية) على معادلة 
سبيرمان - براون لوضعها في الشكل التالي: 


r 


yy 


d [k-(k-1)r, | 


حيث ryy‏ هو OLS‏ البند المعني. على سبيل JELI‏ إذا علمت أن OLS‏ التجزئة النصفية 
لنصفي مقياس مكونين من تسعة بنود تساوي +4 يمكنك حساب F‏ على النحو التالي: 
8ج ee‏ 
—(8)C9)]‏ 9[ 


ويمكنك بعد ذلك dole]‏ حساب GLY‏ للمقياس الكامل المكون من VA‏ بنداً باستخدام 
تساوي )0,+( وعدد البنود k‏ يساوي (VA)‏ في معادلة سبيرمان - براون. وعلى US‏ فإن 
تقدير الثبات للمقياس الكلي يكون: 
5 18 
1+(17~x.5)‏ 


الذي يساوي .+,9€V9l 4,٥ / ٩‏ لاحظ أن زيادة عدد البنود قد زاد من الثبات. إن إلقاء 
نظرة سريعة على معادلة سبيرمان - براون من شأنه أن يجعل من الواضح أنه. إذا كان كل 
شيء متساوياً فإن المقياس الأطول سيكون Glo‏ أكثر ثباتاً من المقياس الأقصر. قد لا يكون 
هذا واضحًا بشكل حدسي أو بديهي. إذا كان لكل بند بعض الإشارات وبعض الضوضاء 
ألا تؤدي إضافة البنود إلى زيادة الضوضاء وكذلك الإشارة؟ الجواب هوء os‏ سوف تزيد 
البنود EUS‏ ومع Gig EUS‏ لورد ونوفيك )2008 (Lord and Novick,‏ أنه بينما يزداد 
الخطأ ths‏ تزداد الإشارة signal‏ أضعافاً مضاعفة عند إضافة البنود (ص. (AT‏ - أي 
إن تباين الدرجة الحقيقية يتراكم بشكل أسرع من تباين درجة الخطأ مع إطالة الاختبار. 
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وهذا مماثل للطريقة التي يصبح بها أي تقدير لمعلمة المجتمع (على سبيل JELI‏ متوسط 
وزن المراهقين في الولايات المتحدة) تدريجياً أكثر gl) Bo‏ أقرب إلى الدرجة الحقيقية 
للمجتمع) مع زيادة عدد الأفراد الذين تم أخذهم في العينة. 


:inter-rater agreement اتفاق المقيّمين‎ 


تضمنت أساليب تقييم الثبات التي ناقشناها حتى الآن على البنود كمؤشرات. ومن 
المؤكد أن هذا مناسب لكتاب عن وضع وتطوير المقياس؛ غير أنه في العديد من السياقات 
البحثيةء يعمل المقيمون أو المحكمون كمؤشرات. على الرغم من عدم وجود صلة 
وثيقة لذلك بتطوير اممقياس» إلا أن مناقشة موجزة لاتفاق المقيمين (انظر دي فيلييس 
DeVellis, 5‏ للحصول على نظرة dole‏ حول هذا الموضوع) تكون مفيدة لأنها هكن 
أن تؤكد التشابه المفاهيمي الذي تشترك فيه مع تقييم الثبات القائم على البند. ففي كلتا 
الحالتينء يفرض المنطق الأساسي أن المؤشرات التي تتقاسم قضية مشتركة يجب أن ترتبط مع 
بعضها البعض. في حالة المقيمين أو المحكمينء إذا كانت الدرجات الناتجة عن ملاحظاتهم 
تعكس خصائص المثير أو المنبه الذي يتم ملاحظته بدلاً من خصائص المحكمينء فينبغي 
عندئذ أن تتفق تلك الدرجات. ويمكن أن تختلف طبيعة هذا الاتفاق تبعاً لأهداف الباحث 
والمنهج المتبع في تقدير اتفاق المقيمين. 
Gs‏ بعض الحالات» سيحتاج الباحث إلى اتفاق صارم من أجل النظر في التقديرات التي 
يمكن التعويل عليها والوثوق بها. وكمثال على US‏ فإن المدى الذي يمكن فيه لاثنين من 
حكام البيسبول (كرة القدم الأمريكية) أن يحددا بشكل ثابت متى يكون ضرب الكرة 
(eee‏ يتوقف على مدى اتفاقهما على سلسله من الأحداث أو المناسبات. يجب 
أن يكون أي ضرب للكرة إما صحيحاً أو is‏ وفقاً لقواعد البيسبول. ومن ثم» فإن الاتفاق 
المطلق يكون LES‏ كوسيلة لقياس مدى LS‏ تقديرات الحكام. وفي ظروف أخرىء قد يقوم 
المقيمون بتقييم ظاهره تختلف على طول سلسلة متصلة. على سبيل JELI‏ من ال محتمل 
ان يستخدم الحكام في سوق ولاية ما يقومون بتقييم نوعية أو جودة الفطائر المخبوزة 
محلياً مقياساً له العديد من الاستجابات بدلاً من التقسيم SLE‏ البسيط (جيد أو سيئ). 
وفي مثل هذه الحالة» قد لا يكون من الضروري التوصل إلى اتفاق دقيق حول الدرجة 
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لتحديد أن تقديرات الحكام المتعددين تعكس في الواقع سمة الفطائر وليست مجرد سمات 
الحكام أنفسهم. وعلى الرغم من أن أحد الحكام قد يكون أكثر تساهلاً من قاض آخر غيره 
وبالتالي يعطي تقييمات أعلى باستمرار, إلا أن الدرجات بين الحكام ينبغي أن تتماثل تقريباً 
إذا كان يجب اعتبارها تتمتع بالثبات. والواقع» قد يكون هذا الأساس الأفضل للحكم على 
الثبات في هذه الظروف بدلاً من الإصرار على الاتفاق التام. والتقييمات التي تم تعيينها 
حتى يكون ترتيب الفطائر ا محرز أو المسجل من الأفضل إلى الأسوأ متشابهاً بين الحكام 
توحي Glow ob‏ الفطائر وليست Slow‏ الحكام هي التي تحدد الدرجات التي تم تعيينها. 
ومع EUS‏ إذا كانت معايير تسجيل الحكام تمت معايرتها بشكل مختلف إلى حد ما Sis)‏ 
إذا اعتبر أحد الحكام أن الدرجة خمسة تمثل متوسط جودة Sp dll‏ بينما أعطى آخر 
للفطيرة متوسطة الجودة ست درجات)» فقد لا يتفق الحكام Mul‏ في الواقع. ومن ثم قد 
لا يكون الاتفاق التام معيارًا Gulio‏ لتقييم الثبات فيما بين الحكام في مثل هذه الحالة. 

وقي ورقه مؤثره dsl‏ وصف باتريك | شروت وجوزيف J‏ فلييس 
(Patrick E. Shrout and Joseph L. Fleiss, 1979)‏ الطرق المختلفة لتقييم اتفاق 
المقيمين في ظل ظروف مختلفة. وأكدوا على أن السمات المهمة لنوايا الباحث تحدد أفضل 
طريقه لتقييم OLY!‏ فيما بين المقيمين. ولأغراض المناقشة الحاليةء فإن أهم dow‏ ناقشوها 
هي ما إذا كان الاتفاق الدقيق أو مجرد التطابق بين المحكمين هشل أفضل دليل على اتساق 
المقيمين. وفي مثال الحكام» من الواضح» أن الاتفاق المطلق سيكون ضرورياً لاستنتاج أي 
من الحكام يتمتع بالثبات. إن نسخة معامل الارتباط داخل الطبقة 100 المناسبة في هذه 
الحالة تعادل أو تساوي معامل كوهن Cohen's kappa (k) LIS‏ (كوهين؛ 1960 (Cohen,‏ 
ويحدد هذ المدخل إلى أي مدي يتجاوز تكرار الاتفاقات الدقيقة بين المحكمين ما يمكن 
توقعه عن طريق الصدفة. leg‏ النقيض من الحكام» هكن لقضاه الحكم على جودة 
الفطيرة أن يبرهنوا على أنهم كانوا يقومون بإصدار أحكام تتمتع بالثبات دون الاتفاق 
الفعلي على ذلك بدقة. نموذج معامل الارتباط داخل الطبقة 100 الذي يعبر عن الاتفاق 
في ظل هذه الظروف يعادل معامل ألفاكرونباخ. 

deg‏ ذلك» يمكن استخدام معامل ألفاكرونباخ عندما يهتم المرء بالمدى الذي يسفر 
فيه أي من البنود أو المقيمين عن درجات تكون متوافقة أو متطابقة. وف WS‏ الحالتينء 
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ينشأ التوافق أو التطابق i)‏ الارتباطات بين البنود وبعضها البعض أو بين المقيمين) بسبب 
التأثير المشترك للمتغير الأساسي على المؤشرات» سواء كانت هذه الأخيرة عبارة عن بنود أو 
مقيمين. وتشكل نسبة تباين الدرجة الملاحظة التي يمكن إرجاعها إلى الدرجة الحقيقية 
للمتغير الكامن OLS‏ المؤشرات في WS‏ الحالتين. وتؤكد هذه المقارنة بين أنواع مختلفة من 
امؤشرات (المقيمين مقابل البنود) تفسير الفائدة العامة لمعامل ألفا كمؤشر على الثبات. 


الاستقرار الزمني: 

هناك طريقة أخرى لحساب الثبات تنطوي على الاستقرار الزمني للقياس 
temporal stability‏ أو مدى بقاء الدرجات أو النتائج ثابتة (مستقرة) من مناسبة أو من 
حالة إلى أخرى. ويّعد ثبات dole]‏ الاختبار Test-retest reliability‏ هي الطريقة ا لمستخدمة 
bole‏ لتقييم ذلك النوع من الثبات. وفي بعض النواحيء يكون ثبات إعادة الاختبار مماثلاً 
ومشابهاً لثبات التجزئة النصفية وثبات النماذج البديلة» والتي تمت مناقشتها سابقاً. وبالعودة 
إلى مثال سابقء افترض أنه بدلاً من تطوير مجموعتين من البنود لقياس رغبة المرضى للتحكم أو 
السيطرة عند التفاعل مع الأطباء وضع باحثنا الافتراضي مجموعة واحدة من البنود. ويمكن 
تطبيق هذه البنود على مجموعة واحدة من المرضى في مناسبتين منفصلتين» ويمكن حساب 
ارتباط الدرجات التي حصلوا عليها في المناسبة الأولى بتلك الدرجات التي حصلوا عليها في 
ال مناسبة الثانية. والأساس المنطقي الذي تستند إليه القرارات المتعلقة بالثبات من هذا النوع 
هو أنه إذا كان المقياس يعكس É>‏ (في الواقع) مغزى لبناء مفاهيمي Store‏ فإنه يجب 
عليه تقييم ذلك المفهوم البنائي بطريقة مماثلة أو متساوية في مناسبات أو حالات منفصلة. 
وبعبارة أخرىء فإن الدرجة الحقيقية للمتغير الكامن ينبغي أن تمارس تأثيراً مشابهاً أو مماثلاً 
على الدرجات الملاحظة في مناسبتين IST gl)‏ في حين ينبغي ألا يظل مكون الخطأ Ób‏ عبر 
تطبيقات المقياس. وبالتالي» ينبغي أن هثل الارتباط بين الدرجات التي تم الحصول عليها عبر 
تطبيقين للمقياس على نفس الأفراد abl‏ الذي يحدد به المتغير الكامن الدرجات الملاحظة. 
وهذا يعادل تعريف الثبات كنسبة التباين التي تعزى إلى الدرجة الحقيقية للمتغير الكامن. 


إن مشكلة هذا المنطق تكمن في أن ما يحدث للدرجات بمرور الزمن قد يتعلق بتعرض 
إجراءات القياس للخطأ أو لا يكون له صله بذلك. ويشير (Nunnally, 1978) «Jbg»‏ 
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إلى أن خصائص أو سمات البنود قد تجعلها تنتج ردودًا مستقرة مؤقنًا حتى عندما يتغير 
المفهوم البنائي محل الاهتمام. على سبيل JEI‏ إذا تأثر مقياس القلق المزعوم (المفترض) 
بالرغبة الاجتماعية وكذلك القلق» فقد تظل الدرجات ثابتة على الرغم من الاختلافات 
أو التباينات في القلق. لن يكون الاستقرار في الدرجات» الذي ينعكس ف الارتباط المرتفع 
بين مناسبات تطبيق المقياس» نتيجة الثبات في الظاهرة موضع الاهتمام. وبدلاً من ذلك 
قد لا تتغير هذه الظاهرة بينما تتغير الدرجات في المقياس. أي إن المقياس قد يكون غير 
ثابت. أو قد تعزى التغييرات في الدرجات إلى عدم الثبات عندما تتغير الظاهرة نفسها في 
الواقع» وقام المقياس بتعقب هذا التغيير بشكل دقيق. والمشكلة هي أن التغيير أو عدم 
التغيير يمكن أن يُعزى إلى مجموعة متنوعة من الأشياء إلى جانب OLS‏ (أو عدم (CLS‏ 
إجراءات القياس. حدد AS”‏ وماكجراث“ )1988 (Kelly and McGrath,‏ أربعة عوامل 
مربكة عندما يفحص امرء مجموعتين من الدرجات لنفس المقياس. بينهما فاصل زمني. 
وهذه العوامل هي )1( التغيير الحقيقي في المفهوم البنائي محل الاهتمام (على سبيل المثال» 
Glo‏ الزيادة في متوسط مستوى القلق بين عينة من الأفراد)» (Y)‏ التذبذبات أو التقلبات 
ا منتظمة ف الظاهرة (على سبيل JEL!‏ التباينات في القلق حول متوسط Cob‏ كدالة في 
الزمن)» (Y)‏ التغييرات التي تعزى إلى الاختلافات في الموضوعات أو طرق القياس بدلاً من 
الظاهرة محل الاهتمام (مثل تأثيرات التعب والإجهاد الذي يتسبب في حدوث أخطاء في 
قراءة (ogi!‏ و(٤)‏ عدم الاستقرار الزمني بسبب عدم الثبات المتأصل في إجراءات القياس. 
والعامل الرابع فقط هو عدم الثبات. 

ومؤخراً ناقش ”يو“ )2005 (Yu,‏ كيف أن الأخطاء في درجات ثبات إعادة الاختبار 
لا تنشأ فقط من أوجه القصور في الأداة نفسها ولكن أيضاً تنتج من الأفراد الذين يتم تطبيق 
المقياس egde‏ والإجراءات الخاصة بتطبيق الأداة. وتشمل الأخطاء الناشئة عن المشاركين 
الذين يجري تقييمهم آثار الانتقال التي يؤثر فيها الأداء في الاختبار الأول على الأداء في 
الاختبار اللاحق. على سبيل JELI‏ قد يتذكر المجيب إجاباته السابقة وقد يرغب في أن يظهر 
بشكل متسق أو ثابت. وبالتاليء فإن الإجابات على التطبيق الثاني للاختبار لا تحددها بشكل 
مباشر حالة المتغير محل الاهتمام» بل يحددها الحافز على الظهور بشكل متسق مع مرور 
الزمن. يشير «يو» إلى مصدر خطأ آخر يرجع إلى المجيب - وهو تأثير التشاور أو المناقشة. 
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وكمثال» قد يأخذ طلاب المدارس الثانوية في البداية اختبار القدرة الدراسية أساساً كوسيلة 
لاكتساب الخبرة في عملية الامتحان. ويمكنهم بعد ذلك التشاور والمناقشة بشأن هذه 
التجربة واستخدامها كأساس pao‏ لاختبار لاحق. وكمثال أخر لتأثير التشاور أو التداولء 
يمكن للمشاركين QU!‏ يجدون أسئلة هجومية في التطبيق Gab!‏ لأداة ما أن يتعمدوا 
حذف أو تشويه إجاباتهم عندما يتم إعادة النظر في البنود وقراءتها. إن أخطاء التطبيق 
التي ذكرها «يو» تتضمن اختلافات في الإجراءات بين الاختبار وإعادة الاختبار (على سبيل 
المثال. السماح للمستجيبين بالعودة والتحقق من الإجابات السابقة)» والتعليمات غير 
الجيدةء والذاتية في تسجيل الإجابات (على سبيل JEL‏ ا معايير الغامضة الخاصة بتسجيل 
الإجابات)» والفترة الزمنية غير المناسبة بين تطبيقات الاختبار. ويمكن لأي من هذه الأنواع 
من الأخطاء أن تقلل من درجات الثبات دون أن تكون الأداة نفسها غير ثابته بطبيعتها. 

وهذا لا يعني أن إثبات الاستقرار الزمني أمر غير مهم. في أي عدد من سياقات البحثء 
قد يكون من الضروري افتراض gl)‏ إثبات) أن القياسات المنفصلة أي التي توجد بينها فترة 
زمنية ترتبط ارتباطًا وثيقًا (عاليا). ومع ذلك فإن الاستقرار الذي نسعى إليه في هذه 
الحالات هو استقرار كل من القياس والظاهرة. وتخبرنا ارتباطات إعادة الاختبار عن القياس 
فقط عندما نكون على ثقة كبيرة من أن الظاهرة ظلت مستقرة وم تتغير. وهذه الثقة لا 
يوجد ما يبررها في كثير من الأحيان. وهكذاء فإن أفضل طريقة dole] GLY‏ الاختبارء على 
الرغم من هميتهاء هي الكشف عن شيء ما حول daub‏ الظاهرة وقياسهاء وليست الأخيرة 
(أي القياس) وحدها. وبالإشارة إلى الثبات أو عدم التغير في الدرجات بمرور الزمن فإن 
الاستقرار الزمني هو الأفضل GY‏ لا يشيرء كما هو الحال بالنسبة GLY‏ إعادة الاختبارء إلى 
أن خطأ القياس هو مصدر أي عدم استقرار نلاحظه. 

إن حساب ثبات إعادة الاختبار dole‏ ما ينطوي على شكل ما من أشكال معامل الارتباط. 
والاختباران اللذان يفصل login‏ فترة زمنية يشبهان وهاثلان مجموعتين من البنود يتم 
تطبيقهما في نفس الوقت. وف الحالة الأخيرة. وكما ذكر LT‏ فإن الارتباط بين البنود 
يعكس حاصل ضرب المسارين الممتدين من المتغير الكامن إلى البنود. ووفقاً لافتراضات 
الاختبارات المتكافئة التامة» تكون لهذه المسارات قيم متطابقة Wis‏ فإن حاصل ضربها 
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تساوي القيمة التربيعية لكل منها. كما هثل كل مسار الارتباط بين المتغير الكامن عند 
طرفه الأصلي واممؤشر عند طرفه النهائي. ومن ثم» فإن مربع هذه القيمة هو الارتباط 
التربيعي» أو نسبة التباين المشترك بين المتغير الكامن والمؤشر. UU‏ فإننا من خلال الربط 
بين البندين» نحصل على القيمة التي هي من الناحية المفاهيمية تعادل أو تساوي )$ إطار 
افتراضات الاختبار المتكافن التام) dus‏ التباين المشترك بين البند والمتغير الكامن. وف 
حالة OLS‏ إعادة الاختبارء يكون المنطق مطابقاً لذلك ولكن المؤشرين هما الآن الأداة التي 
تم تطبيقها في الوقت الأول ثم تم تطبيقها مره أخرى في الوقت الثاني. وينبغي أن يكون 
ارتباطهما هو تقديراً للارتباط التربيعي (وبالتالي» نسبة التباين المشترك) بين الدرجة التي تم 
الحصول عليها (من أي من التطبيقين للأداة) والدرجة الحقيقية للمتغير الكامن. وعندما 
لا يتم الوفاء بافتراضات الاختبارات المتكافئة التامةء تصبح القيمة الناتجة حداً Gol‏ للثبات 
الحقيقي lower bound‏ 

ويشير هذا التحليل إلى أنه يمكن تقدير ثبات مجموعه من البنود يتم تطبيقها في 
مناسبتين أو فترتين زمنيتين من خلال الارتباط بين الدرجات المتحصل عليها من هذين 
التطبيقين. disg‏ من الناحية العملية» هو طريقة حساب ثبات إعادة الاختبار عادة. 
في الظروف الشائعة التي تكون فيها الدرجات الموجودة في أداة الاختبار من نوع القياس 
المستمر أو المتصل أساساً يتم bole‏ استخدام ارتباط بييسون لحاصل ضرب العزوم 
Pearson product-moment correlation‏ وينبغي أن يعمل ارتباط بيرسون بشكل جيد 
في معظم الحالات الخاصة بأدوات القياس التي تم تطويرها باستخدام ا منهج الموضح في 
هذا الكتاب. وإذا كان الباحث قلقاً من أن الدرجات المعنية لا تتطابق مع المقياس من نوع 
القياس الفتري أو المسافي (على سبيل المثال» القياس الترتيبي)» فإنه هكن الاستعاضة بشكل 
بديل عن معامل الارتباط «بيرسون». ومع HS‏ لاحظ أنه حتى لو م يكن كل بند من البنود 
على حدة من نوع القياس الفتري أو المسافي التام» فإن الدرجة القائمة على جمع هذه البنود 
leo‏ سوف تكون متقاربة إلى حد بعيد للبيانات المقاسة على مقياس فتري أو مسافي. 
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الثبات (الموثوقية) 


OLS‏ درجات التغيير: 

هناك ile‏ آخر يستحق منا الاهتمام عند النظر في الثبات عبر الزمن. ونظراً لأن 
المقياس يظهر أنه يتمتع LIL‏ فإن هذا لا يتبعه بالضرورة أن درجات التغيير (اممعروفة 
Lal‏ باسم درجات الفرق أو الاختلاف). والتي يتم حسابها على Lal‏ الفرق بين درجات 
تطبيقين لأداة القياس login Lai‏ فترة dyin}‏ ستتمتع بالثبات بنفس القدر. في الواقع 
Boy‏ العديد من المؤلفين (على سبيل JELI‏ لينء سليندي (VAVV)‏ أوفرال» وودوارد (YIVO)‏ 
(Linn & Slinde, 1977; Overall & Woodward, 5‏ أن درجات التغيير تميل إلى أن 
تكون أقل LS‏ من درجات مقياس تم تطبيقه مرة واحدة وتم الحصول على الدرجات من 
نفس أداة القياس. 

وقبل النظر في هذا لموضوع ودراسته بشكل SÍ‏ دعونا نفكر فيما تمثله ثبات درجة 
التغيير. يفترض مفهوم الثبات بالنسبة لدرجة التغيير أو الفرق أن: )1( هناك تباين في 
التغيير و(ب) أن جزءاً من هذا التباين يعزى إلى فروق حقيقية في التغيير بينما يُعزى الجزء 
الباقي إلى عوامل أخرى gl)‏ الخطأ). ومن المفترضء أن الأفراد في موقف معين تكون لهم 
«درجات حقيقية» مختلفة تمثل تغيراتهم الفردية مرور الزمن. أي إن القيمة الحقيقية 
ALLL‏ للتغيير في الزمن ستختلف من فرد إلى فرد آخر. إلى الحد الذي Sky‏ فيه التباين 
بين الأفراد في درجات التغيير بالاختلافات الفعلية في الدرجات الحقيقية بدلاً من الخطأء 
فإن قياس التغيير هذا يكون ثابتاً. لنأخذ مثالاً مبالغاً فيه (متطرف).إذا تغير كل شخص 
بنفس المقدار GLE‏ فلن توجد اختلافات فردية في الميل إلى التغيير. أي إنه لا يوجد اختلاف 
بين الأفراد في التغيير الحقيقي» وبالتالي» لا يوجد أي ارتباط بين التغيير الحقيقي والتغيير 
الملحوظ LS)‏ هو الحال Glo‏ عندما يكون أحدهم Why (LEE‏ يجب أن تكون dad‏ 
OLS‏ درجة التغيير gl)‏ الارتباط التربيعي بين الدرجات الحقيقية والدرجات الملاحظة) 
تساوي الصفر أيضاً. وبديهياً إذا تغير الجميع في انسجام تام» فمن المحتمل أن نفترض أن 
التغيير هثل نوعًا من التأثير الظرفي بدلاً من السمات الشخصية البحتة. إذا كان الشيء الذي 
يهمنا قياسه هو سمة شخصية. فإن درجة التغيير التي تعكس ف المقام الأول ظاهرة موقفية 
وليست الظاهرة الشخصية هدفنا. 
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الفصل الثالث 


كيف تبدو معادلة ثبات درجات التغيير؟ وكما هو الحال مع أي معامل LS‏ فإن نسبة 
التباين الكلي يمكن أن تعزى إلى التباين الحقيقي. وهكذا: 
تباين الدرجة الحقيقية OL ٠‏ 





تباين الدرجة الملاحظة o?‏ 
40 
Sete owe sis á 2 aa ws g‏ 2 
حيث (A)‏ هي OLS‏ درجة التغيير» و17 6) هي تباين درجة التغيير الحقيقيةء و( 0) 
هي تباين درجة التغيير الملاحظ (أي مجموع تباينات الدرجة الحقيقية والخطأ). وهكننا 
التعامل مع تباينات درجات التغيير OS‏ لدينا تباينات أخرى من التوليفات» أي تساوي 
مجموع كل تباينات المكونات» بالإضافة إلى ضعف تغايراتها. وهذا مماثل لتوسيع النطاق أو 
المقدار الجبري YY‏ + ) إلى 2XY‏ + 2لا + X?‏ 
ومع US‏ نظراً LY‏ نتعامل مع درجات الفروق على الشكل D = ×2 - Y1‏ فإننا نقوم 
بعملية طرح وليست عملية إضافة أو zoe‏ لذلك فإن ا مقدار الجبري هو في الواقع Silos‏ 
للتوسيع (X + (into X? + ¥ - 2XY.‏ ولأن (X2 - X1} = X1 + 222 - 2 (X1 * X2)‏ 
عندما gwg‏ التباين لدرجة الفرق أو التغيير» فإننا نصل إلى: 
2 2 
mpe OT, tOr, —20y1 x9‏ 
a” 2g 2‏ 
xo‏ مر 20 - O xı + Ox.‏ 
حيث يكون المقدران الأوليان في البسط هما تباينات الدرجات الحقيقية لأداة القياس 
الأولية وأداة القياس dio SU!‏ على التوالي» للمقياس موضع الاهتمام؛ والمقدار الأخير في 
للدرجات الملاحظة وليس للدرجات الحقيقية. 
يمكننا تقدير تباينات الدرجات الحقيقية من خلال حاصل ضرب ثبات المقاييس في 
تباينات درجاتها الملاحظة. diag‏ في جوهره» يعطينا نسبة تباين الدرجات الملاحظة التي 
نعتبرها ناتجة أو ناشئة من الدرجات الحقيقية بدلاً من الخطأ. باستخدام هذا الإجراء 
لتقدير التباين الدرجات الحقيقةء يكون المقدار السابق مساوياً J‏ 
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[(031)* (x) |+| (ota) (xaxe) |= [20x1] 


0 ا اا لم 
(ox, )+(o%2)-(26 4,2)‏ 


حيث (re,x2)9 (rx)‏ هي OLS‏ القياسات الأولى والثانية على التوالي. لاحظ أنه في 
WS‏ المعادلتين السابقتين» يكون التغاير (التباين المشترك) متطابقًا في كل من البسط والمقام. 
ويرجع ذلك إلى أنه إذا افترضنا أن الأخطاء غير مرتبطة عبر الزمنء فإن كل التغاير عبر الزمن 
هو تباين يتميز بالثبات. وهذا يعني أن التغاير في الدرجات الملاحظة لا هكن أن ينشأً إلا 
عن التغاير للدرجات الحقيقية إذا استمر افتراض عدم ارتباط الأخطاء LB‏ وبالتالي» فإن 
التغاير الملاحظ والتغاير الحقيقي يكونان نفس الشيء (متساويان). 

باستخدام المعادلة السابقة» يمكننا عمل جدول لماهية ثبات درجة التغيير التي ستكون 
لقيم مختلفة لتباينات الدرجات والتغايرات. لنفترض أن لكلا الدرجات الناتجة عن تطبيق 
الأداة في الوقت الأول والوقت الثاني تباين الوحدة وأن للمقياس موضع الاهتمام نفس 
الثبات في كل من الوقت الأول والوقت الثاني. يممكننا OW‏ أن نرى كيف يؤثر التغاير الخاص 
بهما على SIS‏ درجة التغيير. 


OLS‏ درجة التغيير (TA)‏ عندما تكون درجة الثبات 





Tyxix1 = Tx2x2 = -50 Tyxix1 = Ty2x2 = -70 Ixı,xı = Fxa,xa = -90 





50 .70 -90 





4 67 .89 





38 63 88 
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الفصل الثالث 


مانراه هو أن الثبات الأعلى في وقت واحد يرتبط بزيادة ثبات درجة التغيير (أي إن 
الزيادة في قيم ثبات درجة التغيير من اليسار إلى اليمين عبر أي صف من الجدول)» وهو 
أمر غير مفاجئ أو مثير للدهشة. ما قد يكون أكثر إثارة للدهشة في البداية هو أن التغاير 
الأعلى للدرجات عبر الزمن يؤدي إلى انخفاض ثبات درجة التغيير (أي انخفاض قيم ثبات 
درجة التغيير من أعلى إلى أسفل على طول أي عمود من الجدول). 


يشير روجوسا )1988( Rogosa‏ الذي كان من بين أقوى yo sh)‏ لدرجات usd)‏ 
إلى أن الجداول التي تعطي قيم SLY!‏ فقط للدرجات التي ترتبط Bis!‏ كبيرا عبر الزمن 
(مثل تلك ال موجودة في الصفوف السفلية من الجدول السابق) قد ترسم صورة LEB‏ بشكل 
Y‏ مبرر لها GLY‏ درجات التغيير. ويجادل «روجوسا» Gb‏ التغاير العالي في الدرجات 
عبر الزمن يقيد أو يحد من نسبة التباين الملاحظ في الوقت الثاني والذي يمكن أن يعزى إلى 
الاختلافات الفردية في التغيير. والسبب ف التغاير المرتفع مع مرور الزمن هو أن كل شخص 
يتغير بشكل أساهمي في انسجام تام بدلاً من أن يكون هناك تباین كبير بين شخص وشخص 
آخر في تغيير الدرجات بمرور الزمن. إذا كان هناك تباين أو اختلاف بسيط في المعدل 
الحقيقي للتغييرء فلا هكن أن يكون هناك الكثير من التغاير بين درجة التغيير الحقيقية 
ودرجة التغيير الملاحظة (تذكر أنه لكي يكون هناك تغاير كبير يجب أن يكون هناك تباين 
كبير لكلا المتغيرين). ويذهب «روجوسا» (VAM)‏ إلى القول Al‏ عندما يكون Gb!‏ 
الحقيقي للتباين في معدل التغير كبيراء فإن ثبات درجات التغيير بالنسبة لثبات الدرجات 
في نقطة زمنية واحدة تكون مواتية بدرجة كبيرة. توضح الصفوف العليا من جدولنا هذه 
النقطة. ومع ذلكء فإن الجداول المنشورة في كثير من الأحيان لمم تقدم إلا الظروف القصوى 
المبينة في الصفوف السفلية من الجدول السابق. 


ماذا يعني كل هذا على المستوى العملي أو التطبيقي؟ من المتوقع أن تؤدي الظروف التي 
تحدث فيها الأحداث على مر الزمن إلى تأثير مماثل من حيث الحجم على جميع المشاركينء مما 
سيؤدي إلى ضعف OLS‏ درجات التغيير لأنه لن يكون هناك تباين يذكر بين الناس. lias‏ يعني 
أنه إذا كانت حصة الأسد (الحصة الأكبر) من التباين ناتجة عن عوامل تُعزى إلى مرور الزمن 
(مثل تلقي تدخل يؤثر على جميع المشاركين بالتساوي)» فإن الحصة التي تعزى إلى الاختلافات 
الفردية يجب أن تكون صغيرة نسبياً في ا مقابل. إذا زادت درجات كل الأشخاص من الوقت 
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الأول إلى الوقت الثاني مقدار خمس نقاط على سبيل EL!‏ فيمكنك أن Lad‏ أو تتوقع بدقة 
درجة الوقت الثاني من خلال الدرجة السابقة. وسيكون ارتباط الدرجات في الوقتين هو واحد 
صحيح» ودرجة التغيير الخام ستكون ثابتة gl)‏ خمس نقاط لكل الأشخاص). وبالتالي فإن ثبات 
درجة التغيير ستكون صفراً. وعلى العكس من US‏ فإن الحالات التي يرجح أن تختلف فيها 
التغيرات بمرور الزمن اختلافاً كبيراً من فرد إلى آخر تخلق على الأقل فرصة لكي تكون درجات 
التغيير أكثر ثباتاً. وإذا نظرنا إليها من منظور مختلف SUB‏ إذا كان مقدار التباين قد ساهم في 
درجات الوقت الثاني من خلال درجات الوقت الأول يبلغ ++ 21 تقريباً فإن مقدار التباين في 
درجة الوقت الثاني لا هكن أن تنسب إلى متغيرات أخرى غير درجة الوقت الأول. يتم تحديد 
درجة الوقت الثاني أساساً من خلال الدرجات التي تم تسجيلهاء بغض النظر عما قد حدث بين 
الوقت الأول والوقت GW‏ ومن ثم» فإن مؤشر التغيير المفترض في متغير معين غير حساس 
للتغيرات التي تحدث مع مرور الزمن لا يؤدي وظيفته المقصودة. 

كما تناول «تراوب» )1994( Lal Traub‏ مسألة ثبات درجات التغيير أو الفرق. ويقترح 
أن الافتراضات حول المقاييس المعنية قد تكون إشكالية (معضلة) بشكل خاص losis‏ 
يخطط ehl‏ للنظر في درجات التغيير الخام (على سبيل Sub)‏ درجات الاختبار البعدي 
مطروحاً منها درجة الاختبار القبلي أو التمهيدي). وعلى وجه التحديد. يلاحظ ”تراوب“ 
أن اتساق ما يقيسه المقياس داخل الفترات الزمنية وعبرها يكتسب أهمية خاصة عند 
إدراج وتضمين درجات التغيير. على سبيل SUE!‏ قد يمثل الخروج عن القياس ال مسافي 
أو الفتري الحقيقيء حتى خلال فترة زمنية واحدة. مشكلة لأن التغير في بعض shel‏ من 
نطاق الدرجات قد لا تكون قابلة للمقارنة من حيث الحجم بالنسبة إلى التغيرات المتطابقة 
Lous‏ في blä‏ مختلفة على طول المقياس. وبالتالي» فإن التغير من درجة (Y)‏ إلى (P)‏ قد 
لا يعادل التغير من درجة )0( إلى )1( على مقياس الإعاقة البدنية أو العجز البدني الذي 
يتراوح بين درجة واحدة إلى عشر درجات. d&g‏ مثال آخر يتعلق بالتغيرات من فترة زمنية 
إلى أخرى. قد تتغير الاختلافات (الفروق) فيما يقيسه المقياس نفسه مرتينء إذا استخدم 
الأشفخاصء على سبيل JEL‏ ذاكرة إجابتهم السابقة كدليل لتحديد إجاباتهم على الاختبار 
البعدي بدلاً من أو بالإضافة إلى السمة التي يراد أن يقيسها المقياس. كما يلاحظ «تراوب» 
أيضاً أن المحاولات الرامية إلى تقليل هذه المشكلة إلى so Gol‏ باستخدام مقاييس مختلفة 
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(مثل النماذج المتكافئة أو المتوازية) في الوقت الأول والوقت الثاني قد تؤدي إلى حدوث 
مشكلات إضافية. واحدة من هذه المشكلات هي المعايرة ا مختلفة أو التدريج المختلف. 
ما لم تكن وحدات التغيير على المقياس الأول تعني بالضبط نفس الشيء الذي تعنيه وحدات 
التغيير في المقياس اللاحق» يمكن أن تكون درجات التغيير مضللة. حتى في حالة استخدام 
الاختبارات المتكافئة dogs 5h!‏ يحذر «تراوب» من وجود اختلافات طفيفة في المعايرة أو في 
المتغيرات الكامنة التي تحدد درجاتها. lly‏ فإنه ينصح بعدم استخدام درجات التغيير. 

ويصف «هيويتء. وأندرسنء ومينور» )1992( Hewett, Anderson, and Minor‏ 
خمس إستراتيجيات تحليلية بديله لتصاميم البحوث التي تنطوي على التغيير. بالإضافة 
إلى (I)‏ استخدام درجات التغيير كمتغيرات dab‏ تتضمن هذه الطرق (ب) اختبار التفاعل 
بين عضوية اممجموعة والوقت» (ج) اختبار الاختلافات أو الفروق في المتوسطات في الوقت 
الثاني (د) اختبار الاختلافات أو الفروق في متوسطات الوقت الثاني بعد التحكم في الدرجات 
في الوقت الأول عن طريق تحليل التباين اممصاحب أو المشترك (ANCOVA)‏ و(ه) 
باستخدام تحليل التباين المصاحب أو المشترك ANCOVA‏ اللامعلمي nonparametric‏ 
للضبط والتحكم في متوسطات الوقت الأول. ويخلص ال مؤلفون إلى أنه من الضروري مراعاة 
الدرجات الأولية إذا كانت هذه الدرجات مرتبطة بدرجات لاحقة (كما هو الحال غالباً). 
Why‏ فإنهم يوصون باستخدام حلول تحليل التباين المصاحب أو المشترك ANCOVA‏ 
وا منطق هو أن تأخذ في الاعتبار الحالة الأولية للمتغير التابع قبل فحص SE‏ المتغير المستقل. 
يمكن تنظيم تحليل لهذا النوع بطريقتين متماثلتين على الأقل. أحدهما هي التعامل مع 
المستوى JSI‏ للمتغير التابع على أنه متغير مصاحب covariate‏ والتعامل مع مستواه 
في وقت لاحق كنتيجة. وعلى نحو متساو يمكن للمرء استبدال درجة التغيير كنتيجة. 
هاتان الطريقتان متكافئتان من الناحية الرياضية لأنه من بين الدرجات الأوليةء والدرجات 
اللاحقةء ودرجات التغييرء لا يوجد في الواقع سوى جزأين مستقلين من المعلومات. ومعرفة 
أي اثنين Logie‏ يحدد الثالث qs)‏ هناك درجتان فقط من الحرية بين الدرجات الثلاث). 
التحكم في الحالة الأولية للمتغير هو جزء واحد من المعلومات. ويمكن تمثيل الجزء المتبقي 
باستخدام أي من الجزأين المتبقيين كنتيجة. ومع US‏ من المهم أن ندرك أن استخدام 
درجة التغيير كنتيجة عندما يتم التحكم في الحالة الأولية لا يختلف عن استخدام درجة 
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التغيير الخام كنتيجة دون تعديل للحالة الأولية للمتغير. إن إدراج الحالة الأولية كمتغير 
ضابط أو متغير تحكم يتجنب العديد من المشاكل المرتبطة بعدم ثبات درجة التغيير بسبب 
أنها درجة التغيير الخام (أي غير المعدلة) التي تخضع لعدم الثبات. 

وفي الآونة الأخيرة. لاحظ «كروين 339619 وسيجتسما» Kruyen, Emons, and‏ 
Sijtsma (2014)‏ مشكلات أو قضايا إضافية يمكن أن تصيب أو تكون مصدر إزعاج لدرجات 
التغيير. وبشكل أكثر تحديدًاء تتناول ورقتهم الاستخدام الشائع لدرجات التغييرء أي تقييم 
التغيير الفردي في السياق السريري. على سبيل المثالء قد يرغب أحد ممارسي الصحة العقلية 
في تقييم ما إذا كان المريض قد عانى من أعراض منخفضة أو أقل بعد تلقي العلاج أو ما إذا كان 
هذا المريض قد تحول وانتقل عبر حد التشخيص وأنه لم يعد من الممكن اعتباره مبررًا لتشخيص 
سابق. قد لا يتم استخدام ثبات المقياس على نحو مناسب لتحديد ما إذا كانت الاستنتاجات 
على المستوى الفردي مبررة أم Y‏ وكما يلاحظ «كروين وآخرون» )2014 (Kruyen et al,‏ أن 
الثبات هو في الأساس خاصية لأداء المقياس عبر مجموعة من المجيبين. وبالتالي» فإن تطبيقه 
لإصدار أحكام بشأن التغييرات في الأفراد يثير مشاكل. ينشأ أحد السيناريوهات الشائعة 
ولكن إشكالي بشكل خاص عندما يحاول الطبيب تحديد مقدار تغير الفرد Fla‏ على اختلافات 
الدرجات بمرور الزمن باستخدام مقياس Bind pad‏ ويحذر كروين وآخرون )7١١6(‏ من 
أنه في الحالات التي يكون فيها المقياس مكوناً من أقل من عشرة ogu‏ فإن استخدامه بهذه 
الطريقة يمكن أن يؤدي إلى معدل مرتفع بشكل غير مقبول من الأحكام الخاطئة. 

وكما هو الحال بالنسبة للعديد من الموضوعات الأخرى في هذا الكتاب» فإن أفضل 
الممارسات التي ينبغي اتباعها هي التفكير في الظروف المتاحة وكيفية تعاملها مع البيانات 
المتاحة والافتراضات الخاصة بمختلف النهج أو الطرق. ستكون هناك ظروف تجعل درجات 
التغيير ذات مغزى eS‏ ولا سيما عندما تؤخذ الدرجات الأولية في الاعتبارء تعمل بشكل 
جيد. وفي حالات أخرىء ولا سيما عند التفكير في استخدام درجات التغيير الخام» قد يكون 
هناك ما يبرر اتباع نهج آخر. إن المجموعة الكاملة من الظروف الممكنة والنهج الممكنة 
كثيرة للغاية بحيث لا يمكن مناقشتها هنا. ومع US‏ لا ينبغي تجاهل الرسالة الأساسية 
لهذا القسم - وهي أن ثبات درجة التغيير لا يمكن اعتبارها مساوية GLY‏ الدرجات مقياس 
يتم تطبيقه في وقت واحد. 
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الثبات والقوة الإحصائية: 

من الفوائد التي كثيراً ما يتم تجاهلها أو التغاضي عنها في كثير من الأحيان في المقاييس 
الأكثر GLE‏ أنها تزيد من القوة الإحصائية لحجم عينة معين gl)‏ تسمح لحجم عينة أصغر 
بتوليد قوة مكافئة أو مساوية لحجم عينة أكبر)» مقارنة بالمقاييس الأقل GL‏ وللحصول 
على درجة محددة من الثقة في القدرة على اكتشاف فرق بمقدار معين أو معنوي بين 
مجموعتين تجريبيتينء على سبيل JEL‏ يحتاج المرء إلى ius‏ ذات حجم معين. ويمكن زيادة 
احتمال اكتشاف مثل هذا الاختلاف أو الفرق (أي قوة الاختبار الإحصائي) عن طريق زيادة 
حجم العينة. وف العديد من التطبيقات» يمكن الحصول على نفس التأثير عن طريق تحسين 
ثبات المقياس. والمقياس الذي يتمتع LIL‏ مثل العينة الكبيرةء يسهم في تقليل الخطأ 
نسبياً في التحليل الإحصائي. قد يكون من الأفضل للباحثين أن يقوموا بتقييم المزايا النسبية 
لزيادة ثبات المقياس مقابل حجم العينة في حالات البحث التي يتوفر فيها كلا الخيارين. 


تعتمد القوة المكتسبة من تحسين الثبات على عدد من العواملء ما في ذلك حجم 
العينة Agi!‏ ومستوى الاحتمال ا محدد لاكتشاف Las‏ من النوع الأول ‘Type I error‏ 
وحجم التأثير lie)‏ متوسط الفرق) الذي يعتبر معنوياً أو ذا دلالة إحصائية» ونسبة تباين 
الخطأ الذي يُعزى إلى قياس عدم الثبات بدلاً من عدم تجانس العينة أو مصادر أخرى. 
وتتطلب القارنة الدقيقة بين تحسين الثبات وزيادة حجم العينة تحديد هذه العوامل؛ 
ومع US‏ توضح الأمثلة التالية هذه النقطة. في حالة بحث افتراضية يكون ud‏ احتمال 
وجود خطأ من النوع الأول »)٠,٠١(‏ والفرق يبلغ عشر نقاط بين المتوسطين يعتبر مهما 
وتباين الخطأ يساوي ٠٠١‏ فإنه يجب زيادة حجم العينة من VVA‏ إلى WY‏ (زيادة العينة 
بنسبة (X YE‏ لرفع قوة اختبار F (G)‏ من ٠,۸١‏ إلى ٠,6١‏ وسيكون لتقليل تباين الخطأ 
الإجمالي من ٠٠١‏ إلى VO‏ (انخفاض بنسبة (X YO‏ نفس النتيجة بشكل أساسي دون زيادة 
حجم العينة. وقد يحقق استبدال مقياس آقل BLS‏ مقياس آخر يتمتع بمستوى Jle SUS‏ 
نفس النتيجة. وكمثال آخرء بالنسبة لعينة حجمها يساوي +0 )50 = (N‏ هناك Sule‏ 
بمستوى ثبات قدره ۰,۳۸ ويرتبطان معاً معامل ارتباط قدره )0.24 = (r‏ بالكاد يحققان 
معنوية أو مستوى دلالة إحصائية عند (10.> م). إذا تمت زيادة مستوى ثباتهما إلى .٠0,5١‏ 
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إلى معامل ارتباط ذي دلالة إحصائية عند (01.> (p‏ ويوفر لبيسي Lipsey‏ )+144( مناقشة 
أكثر شمولاً حول القوة الإحصائيةء ما في ذلك تأثيرات ثبات القياس. 


يتم تعزيز وتحسين الثبات إما من خلال عدد البنود أو الفقرات ومتوسط الارتباط بين 
البنود (والذي Lay‏ من ارتباط أقوى بين كل بند والدرجة الحقيقية)؛ إما إضافة المزيد من 
البنود أو الحصول على بنود أفضل يزيد من الثبات للمقياس. ويمكن لأي من طريقتي 
تحسين الثبات أن تزيد وتعزز القوة الإحصائية. ومرة أخرى» هذا يشبه وهاثل الوسيلة 
التي يمكن بها للمعاينة (طرق أخذ العينات) أن تزيد من القوة الإحصائية. ويمكن أن 
يؤدي تقليل خطأ المعاينةء إما عن طريق اختيار عينات «أكبر من حيث الحجم» (أي جمع 
البيانات من dus‏ أكبر) أو أخذ عينات FS‏ ذكاءً» asl)‏ جمع البيانات من الأفراد الذين 
يمثلون المجتمع الإحصائي موضع الاهتمام أفضل تمثيل). إلى زيادة القوة الإحصائية. وبا مثلء 
يمكن أن تقلل المقاييس الأكبر (التي تتضمن بنوداً أكثر) والأكثر ذكاءً (وجود ارتباطات 
أقوى بين البنود وبعضها البعض) من التباين الناتج عن Las‏ القياس» وبالتالي» زيادة القوة 
الإحصائية. 


نظرية التعميم: 

حتى الآن» لقد ركزت مناقشتنا حول GLY!‏ على تقسيم التباين الملاحظ إلى الجزء الذي 
يُعزى إلى الدرجة الحقيقية للمتغير الكامن والجزء ا متبقي» وهو الخطأ. يقدم هذا القسم 
بإيجاز إطار عمل أكثر عمومية لتقسيم التباين بين مصادر الخطأ والمصادر الأخرى غير 
الخطأ. ويعود هذا الإطار إلى مناقشتنا السابقة agi‏ أو المداخل القائمة على تحليل التباين 
ANOVA‏ للتمييز بين مصادر التباين. 

قبل أن نطبق فكرة التقسيم الأكثر دقة لتباين الخطأ على القياس» دعونا ننظر في مثال 
بحثي أكثر عمومية يتم فيه فحص مصادر التباين المتعددة. لنفترض أن الباحث أراد تحديد 
فعالية برنامج تدريبي يهدف إلى زيادة الإنتاجية المهنية. علاوة على US‏ نفترض أن 
الباحث قام بتطبيق وإدارة البرنامج التدريبي لعينة كبيرة من أساتذة الجامعات وعلى عينة 
مماثلة من الفنانين. وحدد الباحث Las)‏ مجموعات مماثلة من الأساتذة والفنانين الذين لن 
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يشاركوا في البرنامج التدريبي ولكنهم سيشاركون في نفس تقييم الإنتاجية الذي يشارك فيه 
ا مشاركون في البرنامج التدريبي. عند التفكير في الدراسة بعض الشيء» قد يكون هذا الباحث 
vale‏ إلى أن ملاحظات الإنتاجية ستعكس تشغيل ثلاثة مصادر محددة للتباين المنهجي أو 
ا منتظم: )١(‏ مشارك مقابل غير مشارك» (Y)‏ أستاذ جامعي مقابل فنان» و(۳) تفاعل هذه 
الآثار أو التأثيرات. وتتمثل إحدى الإستراتيجيات التحليلية المعقولة أو المنطقية في هذا 
الموقف في إجراء تحليل التباين ANOVA‏ على درجات الإنتاجية» ومعالجة كل مصدر من 
jolas‏ التباين هذه كبعد في التحليل. ويمكن للباحث Bus‏ أن يحدد إلى أي مدى يساهم 
كل مصدر من مصادر التباين في التباين الكلي في الإنتاجية المهنية. في جوهرهاء فإن هذه 
الإستراتيجية التحليلية ستقسم التباين الكلي بين درجات الإنتاجية الملاحظة إلى عدة مصادر 
هي: المشاركة في التدريبء والمهنة. وتفاعل هذه العواملء والخطأ. ويمثل الخطأ جميع 
مصادر التباين بخلاف تلك المحددة بواسطة العوامل السابقة. 

الآنء لنأخذ في الاعتبار حالة افتراضية يقوم فيها Coll‏ بتطوير مقياس الرغبة في 
الاستقلال الذاي. وسوف يستخدم هذا المقياس في دراسة للمسنينء والذين قد يواجه 
بعضهم مشاكل بصرية. وبالتالي» يخطط الباحث لإدارة أو تطبيق مقياس الرغبة في 
الاستقلال الذاتي شفوياً لهؤلاء لأشخاص الذين سيصعب عليهم القراءة وفي شكل مكتوب 
للمشاركين المتبقين في الدراسة. 

إذا تجاهل الباحث طريقة إدارة أو تطبيق المقياس (المكتوبة مقابل الشفهية) كمصدر 
للتباين في درجات الاختبارء فإنه سيكون فيما يتعلق بكل درجة تم الحصول عليها بسبب 
المستوى الحقيقي لرغبة المجيب في الاستقلال الذاتي بالإضافة إلى درجة ما من الخطأ. 
ويمكن للباحث أن يواصل حساب GLY!‏ كما سبق مناقشته. ومع US‏ لاحظ أن مجرد 
حساب معامل “WI”‏ على درجات المقياس دون الأخذ في الاعتبار طريقة إدارة أو تطبيق 
المقياس لن هيز الخطأ المنهجي المحتمل الناتج عن طريقة تطبيق المقياس عن أي مصدر 
خطأ آخر. 

وكبديل WI‏ يمكن للباحث الاعتراف بوضع طريقة إدارة أو تطبيق المقياس كمصدر 
للتباين بين الدرجات» باستخدام أسلوب تحليل التباين. إذا أظهرت نتائج التحليل أن الفرق 
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بين أساليب إدارة وتطبيق المقياس dig‏ نسبة غير مهمة من التباين الكلي في الدرجات, 
حينئذ يمكن للباحث أن يكون لديه ثقة أكبر في إمكانية مقارنة الدرجات بالنسبة للأفراد 
الذين أكملوا الإجابة على المقياس إما بالصيغة الشفوية أو المكتوبة. أما إذا كان هناك 
مقدار كبير من التباين الكلي الملاحظ في الدرجات يُعزى إلى طريقة إدارة وتطبيق اممقياسء 
فإن الباحث سيعلم أن أي تفسير للدرجات ينبغي أن يأخذ هذا الفرق بين الأنماط في 
الاعتبار. 

توفر نظرية التعميم de)‏ سبيل (Cronbach, Gleser, Nanda, & Rajaratnam, 1972 «Jl!‏ 
إطارًا لدراسة مدى إمكانية افتراض تكافؤ عملية القياس عبر بُعد واحد أو أكثر. وفي المثال 
السابق» كان البعد موضع الاهتمام هو طريقة إدارة وتطبيق المقياس. وكل يُعد من الأبعاد 
موضع الاهتمام هو مصدر محتمل للتباين ويشار إليه على أنه وجه واحد أو جانب واحد 
facet‏ ويركز JELI‏ على أسلوب إدارة وتطبيق المقياس باعتباره المصدر الوحيد المحتمل 
للتباين (بخلاف الأفراد) الذي يرغب الباحث في تعميمه. UU‏ هذا JULI‏ ينطوي على 


وجه أو جانب واحد. 


وفي لغة نظرية التعميم» تشكل الملاحظات التي يمكن الحصول عليها عبر جميع مستويات 
أحد الأوجه (على سبيل JEL‏ مع كل من أسلوب الإدارة أو التطبيق الشفوي والمكتوب 
للمقياس) le‏ من الملاحظات المقبولة. ويشار إلى المتوسط الحسابي لهذه الملاحظات باسم 
الدرجة الكلية universe score‏ وهي تشبه الدرجة الحقيقية في نظرية الاختبار الكلاسيكية 
.(Allen & Yen, 1979) classical test theory‏ وتسمى الدراسة التي تهدف إلى تحديد 
مدق Slt BL‏ اق رجات ie‏ امترات الحا من الوه يانم dasa”‏ اة 
التعميم “generalizability study‏ أو .«G-study»‏ وتعد الدراسة الافتراضية للرغبة في 
الاستقلال GIUI‏ مثالًا على دراسة ”إمكانية التعميم“ بحكم معالجتها لتأثيرات اممستويات 
المختلفة لوجه أو جانب طريقة إدارة أو تطبيق المقياس. 

والغرض من دراسة إمكانية التعميم «G-study»‏ هو مساعدة الباحث في تحديد المدى 
الذي يقوم به الوجه facet‏ في الحد من التعميم أو عدمه. إذا كان هناك وجه (على سبيل 
JELI‏ أسلوب الإدارة أو التطبيق) يفسر قدرًا كبير؟ من التباين في الدرجات ال ملاحظة: فإن النتائج 
لا تعمم عبر المستويات (مثل الإدارة الشفوية مقابل الإدارة المكتوبة) لهذا الوجه أو الجانب. 
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ويتم التعبير عن مدى إمكانية التعميم عبر مستويات الوجه facet‏ دون تحريف البيانات 
بمعامل إمكانية التعميم generalizability coefficient‏ ويتم حساب هذا المعامل Sole‏ 
عن طريق تكوين نسبة من متوسط المربعات المناسبة الناتجة عن تحليل التباين التي يتم 
إجراؤها كجزء من دراسة إمكانية التعميم .G-study‏ ومن الناحية النظرية» فإن معامل 
إمكانية التعميم هو نسبة التباين في الدرجات الكلية إلى تباين الدرجات الملاحظة وبالتالي 
فهو مماثل ومشابه ممعامل الثبات )1979 (Allen & Yen,‏ ومع ذلك لاحظ أنه إذا 
أسفرت دراسة إمكانية التعميم عن معامل تعميم died‏ فإن تصميم الدراسة يشير إلى 
مصدر المشكلة asi)‏ الجانب أو الوجه الذي تم فحصة). فمعامل الثبات لا يحدد سوى 
مقدار الخطأ دون أن يعزى ذلك إلى مصدر محدد. 


وفي بعض الحالات» قد يكون اختيار تصميم تحليل التباين ال لمنااسبء وتحديد التأثيرات 
التي تتوافق أو تتطابق مع جوانب الاهتمام» وبناء معامل إمكانية التعميم الصحيح 
Izoli‏ كما هو الحال مع تحليل التباين بشكل عام مكن le‏ متعددة, وتأثيرات 
متداخلة» ومتقاطعة» ومختلطة أن تجعل دراسة إمكانية التعميم معقدة. (انظر مايرز 
59 أو كيرك 1990 1995 Myers 1979, or Kirk‏ للاطلاع على المناقشات العامة 
حول تصميمات تحليل التباين) وينصح بالحفاظ على تصميم دراسة إمكانية التعميم 
بسيطة. ومن الحكمة أيضاً الرجوع إلى مصدر يشرح بالتفصيل كيفية sly‏ نمموذج تحليل 
التباين المناسب لنوع معين من دراسات إمكانية التعميم. ويصف «كروكر والجينا» 
(Crocker and Algina,1986)‏ التصميمات المناسبة للعديد من دراسات مختلفة لها 
جانب أو وجه واحد واثنين من دراسات إمكانية التعميم. كما يوفر هذا ا لمصدر مقدمة 
عامة جيدة لنظرية التعميم. 
ملخص: 

تتمتع المقاييس بالثبات بقدر ما تتكون من بنود أو فقرات ثابته تشترك في متغير كامن 
عام أو مشترك. ويتوافق معامل «ألفا» بشكل وثيق مع التعريف التقليدي للثبات كنسبة 


التباين في المقياس الذي يعزى إلى الدرجة الحقيقية للمتغير الكامن. الطرق المختلفة 
لحساب GLY)‏ لها فائدة مختلفة في حالات معينة. على سبيل المثالء إذا لم يكن لدى 
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الشخص إمكانية الوصول إلى إصدارات متكافئة من مقياس معينء فإنه من ا مستحيل حساب 
ثبات النماذج البديلة. الباحث الذي يفهم مزايا وعيوب الأساليب البديلة لحساب الثبات 
يكون في وضع أفضل لاتخاذ أحكام مستنيرة عند تصميم دراسة القياس أو تقييم تقرير 
(دراسة) منشور. إن SLY!‏ هو قضية تتجاوز الاهتمامات والسياقات البحثية المختلفة. 
وتستخدم كلا من نظرية إمكانية التعميم ونهج معامل الارتباط داخل الطبقة لتقييم الثبات 
وكلتا الطريقتين تستغل قدرة تحليل التباين لعزل مصادر التباين المنفصلة وقياسها كمياً 
وهكذاء فإن الأنشطة البحثية التي تبدو على أنها متباينة كدراسة لإمكانية التعميم» والتقييم 
النفسي (السيكومتري) لبنود الاستبانة» وتقييم ثبات ا مقيّمين. جميعها تقوم على تعريف عام 
ومشترك للثبات كنسبة التباين التي تعزى إلى الدرجة الحقيقية للظاهرة موضع الاهتمام. 


تمارين: 

-١‏ إذا كانت هناك مجموعة من البنود أو الفقرات لديها اتساق داخلي tae‏ ماذا يعني 
ذلك بشأن علاقة هذه البنود بالمتغير الكامن الخاص بها؟ 

-Y‏ في هذا التمرين" افترض أن ما يلي هو مصفوفة تغاير لمقياس (Y)‏ يتكون من ثلاثة بنود 
هي (X39 X29 X1)‏ 





$(X39 X29 X1) BM ما هو التباين لكل من البنود‎ - Í 
(Y) ب- ما هو تباین المقياس‎ 
S(Y) ج- ما قيمة معامل «ألفا» للمقياس‎ 
test-retest reliability ناقش الطرق التي يربك بها أو يخلط أسلوب ثبات إعادة الاختبار‎ -Y 
عوامل أخرى بخصائص اللقياس الفعلي.‎ 
منطق ثبات النماذج البديلة من افتراضات الاختبارات المتكافئة؟‎ GL كيف‎ -E 
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0- عند فحص زوج من الدرجات على نفس التغير لنفس الأفرادء تم تطبيقه في وقتين 
مختلفين Us)‏ سبيل المثال» درجة الاختبار القبلي تسمى 1× ودرجة الاختبار البعدي 
تسمى (X2‏ كيف هكن لقوة الارتباط بين الدرجات gl)‏ الارتباط الذاتي الخاص بهم) 
أن تؤثر على OLS‏ درجة التغيير المحسوبة بطرح درجة من الأخرى. على سبيل JLI‏ 
$(X2- X1)‏ 

1- تمثل جميع معاملات الثبات تقريباً نسبة من نوع واحد من المعلومات بالنسبة لنوع 
آخر. في الواقع» هذه النسبة تشكل Lobel‏ تعريف الثبات. اشرح باختصار ما هما 
leg‏ المعلومات الأساسيّان لتعريف dfg GLY!‏ عند التعبير logic‏ كنسبة» هما الأساس 
ممعاملات OLY)‏ 

-V‏ ما هي بعض الانتقادات لاستخدام معامل ألفا؟ ومتى تنطبق هذه الانتقادات؟ وما هي 
العلاجات أو البدائل الموجودة للاستخدام التقليدي للمعامل ألفاء ومتى تكون مناسبة؟ 


ملاحظات: 

-١‏ بالنسبة للبنود cdigigh!‏ يتم ضرب التغايرات في حاصل ضرب التباينات في مربعات 
أوزان البنود المقابلة لها. انظر (154-156 (Nunnally, 1978, pp.‏ للحصول على 

-Y‏ خلال الكتاب» سوف يظهر حل أي تمرين يتطلب إجابة رقمية في حاشية. 


-Y‏ الإجابات: Vlg ٠,١ ١,۲ (I)‏ (التي تبلغ ١,5)؛‏ (ب) ۷,١‏ (مجموع جميع البنود في 
المصفوفة)؛ (ج) (۲/۳) * le = ])ال,٠ /٤,١(-١[‏ 
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في yo‏ يتعلق الثبات gig‏ تأثير متغير على مجموعة من ogil‏ فإن الصدق يتعلق Lg‏ 
إذا كان المتغير هو السبب الأساسي لتغاير البنود. وبقدر ما يكون المقياس ثابتاًء فإن التباين 
في درجات المقياس يمكن أن يُعزى إلى الدرجة الحقيقية لبعض الظواهر التي تمارس تأثيراً 
سببياً على جميع البنود أو الفقرات. ومع EUS‏ فإن تحديد درجة LS‏ المقياس لا يضمن أن 
المتغير الكامن الذي تتشارك البنود فيه» في الواقع» هو المتغير امهم لمطور المقياس. وأن مدى 
كفاية المقياس كمقياس stove gib‏ (مثل الضغوط النفسية المدركة) هي مسألة صدق. 

وقد أعطى بعض المؤلفين معنى أوسع Gra‏ على سبيل المثال» وصف ميسيك 
Messick (1995)‏ ستة أنواع أو أماط من الصدقء أحدها (الصدق التتابعي 
(consequential validity‏ يتعلق بتأثير الطريقة التي يتم بها استخدام درجاتهم على 
المجيبين. وعلى الرغم من أن آراء ”ميسيك“ بشأن الصدق أثارت بعض القضايا المثيرة 
Saul)‏ فإن نظام التصنيف الخاص به لم يُعتمد على نطاق واسع. ووفقاً للتفسير الأكثر 
تقليدية (المحافظ). يتم استنتاج الصدق من الطريقة التي تم بها بناء وتكوين المقياسء أو 
قدرته على التنبؤ بأحداث محددة, أو علاقته بمقايبس مفاهيم بنائية أخرى. وهناك ثلاثة 
أنواع أساسية من الصدق التي تتوافق مع هذه العمليات وهي: 

.Content validity صدق المحتوى‎ -١ 
.Criterion-related validity الصدق المرتبط محك أو معيار‎ -Y 
-Construct validity أو صدق التكوين الفرضي‎ GUI الصدق‎ -Y 

وسيتم استعراض US‏ نوع بإيجاز. وللحصول على معالجة JST‏ شمولاً للصدق» 
Le‏ 3 ذلك مناقشة القضايا المنهجية والإحصائية المتعلقة بالصدق habl‏ بمحك 
ومؤشرات الصدق البديلةء انظر الفصل العاشر في OLS‏ ”غيسيلي» وكامبلء وزيدك“ 
Campbell, and Zedeck (1981)‏ ,ثلءو1ط6. وقد يرغب القراء أيضاً في النظر في عرض 
ميسيك )1990( الأكثر شمولاً لموضوع الصدق. 
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صدق المحتوى أو المضمون: 

يتعلق Gro‏ المحتوى بكفاية عينة البنود - أي المدى التي تعكس فيها مجموعة محددة 
من البنود نطاق أو مجال المحتوى. ويكون تقييم صدق المحتوى أسهل عندما يكون المجال 
أو النطاق (على سبيل JELI‏ جميع مفردات الكلمات التي يتم تدريسها لطلاب الصف 
السادس) محدداً بشكل جيد. وتكون المسألة أو المشكلة أكثر صعوبة عند قياس السمات 
مثل المعتقدات أو المواقف والاتجاهات أو التصرفات لأنه من الصعب تحديد huab‏ 
ما هو نطاق البنود ال محتملة ومتى تكون عينة من البنود ممثلة للنطاق أو المجال. من 
الناحية النظرية» يتمتع المقياس بصدق المحتوى عندما تكون بنوده مجموعة فرعية تم 
اختيارها عشوائيًا من مجموعة كلية من البنود ال مناسبة. في Je‏ اختبار المفردات المستخدم 
أعلاه (مفردات الكلمات التي يتم تدريسها لطلاب الصف السادس». يمكن تحقيق ذلك 
بسهولة. حيث سيتم تعريف كل الكلمات التي تم تدريسها خلال العام الدراسي على 
أنها المجموعة الكلية للبنود. وبعد ذلك ممكن أخذ مجموعة فرعية من هذه الكلمات 
كعينة. ومع Ld‏ في حالة قياس اممعتقدات» على سبيل JEBI‏ لا توجد لدينا قائمة AEL‏ 
من البنود ذات الصلةء إلا أن أحد أساليب أو طرق تطوير مقياس ما (على سبيل المثالء 
مراجعة البنود من قبل الخبراء من حيث صلتها بمجال الاهتمام» كما هو مقترح في الفصل 
الخامس) يمكن أن تساعد في زيادة ملاءمة البند. على سبيل JELI‏ إذا كان الباحث بحاجة 
إلى وضع مقياس يتناقض مع النتائج المتوقعة والنتائج ا مرجوة He)‏ سبيل SUL!‏ توقع 
إشراك ال مريض في صنع القرار مقابل رغبة الطبيب في إشراك ال مريض في صنع القرار)» فقد 
يكون من المستحسن OLE!‏ أن جميع النتائج SIS‏ الصلة كانت ممثلة في البنود. وللقيام 
HL‏ قد يكون للباحث زملاء على دراية بسياق البحث يقومون بمراجعة AEB‏ أولية من 
البنود واقتراح مجالات المحتوى التي تم إهمالها ولكن ينبغي إدراجها في المقياس. ويمكن 
بعد ذلك إضافة بنود تعكس هذا ال محتوى. 

يرتبط Gro‏ المحتوى ارتباطًا وثيقًا بتعريف المفهوم البنائي قيد الدراسة. وبكل dbl‏ 
يجب أن يعكس محتوى ال مقياس التعريف المفاهيمي أو التصوري المنطبق على هذا 
المقياس. قد تكون بعض المفاهيم قد تم تعريفها بأكثر من طريقة من قبل ال منظرين 
أو قد تقع عند تقاطع أو التقاء مفاهيم متعددة. ومن الضروري أن يتضمن محتوى البنود 
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جوانب الظاهرة التي تم توضيحها في تعريفها المفاهيمي أو التصوري وليست الجوانب 
الأخرى التي قد تكون dbo SIS‏ ولكنها خارجة los‏ يقصده الباحث لتلك الأداة ا معينة. 
وكمثال على pb US‏ «ستربا وزملاؤه» )2007( Sterba and colleagues‏ بتطوير 
مقياس الفعالية الزوجية المتعلقة بكيفية إدراك الأزواج الذين أصيب أحدهم بالتهاب 
المفاصل الروماتويدي لقدرتهم على إدارة المرض كفريق واحد. وكانت هذه الأداة هي 
الأولى لتقييم الفعالية الزوجيةء وثقة الزوجين في قدرتهم كفريق واحد على اتخاذ مختلف 
الإجراءات لتعزيز الصحة. وهكذاء كان المفهوم الأساسي للأداة مختلقًا عن المفاهيم الأخرى 
مثل الفعالية الذاتية الفرديةء على الرغم من أنه ذو صله lgs‏ وكانت المرحلة الأولى من 
هذا الجهد عبارة عن دراسة لتطوير البنود والتي شكلت الأساس لادعاءات المؤلفين حول 
صدق المحتوى. وتهدف هذه الدراسة إلى تحديد المحتوى المناسب من الأدبيات التجريبية 
والنظرية الأوسع Él‏ لإدراجها في المقياس. على الرغم من أن المؤلفين قاموا بفحص 
المحتوى مقاييس المفاهيم البنائية ذات الصلة (على سبيل JELI‏ الفعالية الذاتية الخاصة 
بالتهاب (Jolit‏ فقد قاموا بتوجيه تطوير agil‏ الخاص بهم إلى سمات أو خصائص 
محددة للمفهوم البنائي كما حددوه. وتنطوي أحد الجوانب المهمة من هذا التعريف على 
مدى شعور الأزواج بالثقة بأنهم» كفريق tole‏ يمكنهم إدارة تحديات المرض. Flag‏ على 
ذلك» فقد اشتملت دراسة تطوير البنود على مقابلات مع الأزواج لمعرفة أفكارهم حول 
ما إذا كان المفهوم البنائي يتوافق ogre‏ ولفهم كيفية تصورهم AI‏ وتحديد اللغة التي 
استخدموها لوصفه. إن الأفكار والرؤى المستقاة من التعريف النظري للمفهوم البنائي» 
ومراجعة الأدبيات» والمقابلات مع المرضى تم الاسترشاد بها عند بناء وتكوين البنود. وقد 
تمت كتابة البنود بشكل صريح للتعبير عن جانب تصور فريق الأزواج فيما يتعلق بالفعالية. 
وقد ضمنت هذه العملية أن محتوى البنود يعكس المفهوم البنائي المحدد الذي كان 
الباحثون مهتمين به وليس مفاهيم أخرى مختلفة (مثل الفعالية الذاتية أو الدعم الزوجي 
المدرك) والتي قد تكون GIS‏ صلة بها من الناحية النظرية. وكخطوة إضافية للتحقق من 
صدق ال محتوىء فقد Ljw» odb‏ وآخرون»» )2007( Sterba et al.‏ من مجموعة من خبراء 
المحتوى مراجعة البنود التي طورها فريق البحث في البداية في ضوء تعريفهم النظري. 
وكان هذا الإجراء بمثابة تحقق إضافي من أن البنود كانت تمثل ال محتوى ذا الصلة الذي 
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تم تصميم الأداة لقياسه. وإجمالا فقد زادت هذه الخطوات من احتمال تضمين وإدراج 
المحتوى ذي الصلة في المقياس في حين مم يتم إدراج المحتوى غير ذي الصلةء مما يدعم 
الادعاءات بصدق ال محتوى. 


نطاق المتغير والآثار المترتبة على صدق المحتوى: 

dé‏ مسألة أو قضية مرتبطة ارتباطًا وثيقًا بصدق المحتوى تتمثل في نطاق scope‏ المتغير 
موضع الاهتمام وبالتالي البنود التي تؤلف المقياس. من المحتمل أن يكون الباحث age‏ 
peie‏ شامل مثل ieg‏ الحياة أو تفضيلات الشراء أو بمتغير أكثر تحديدًا Jis (É)‏ 
السعادة أو الوعي بالتكلفة. وبطبيعة الحالء فإن المحدد الأساسي لما نقيسه ينبغي أن 
تكون الأسئلة التي نسعى للإجابة عليها وفهمنا للقضايا النظرية ذات الصلة بتلك الأسئلة. 
وفي الوقت نفسه. ينبغي أن نضع في اعتبارنا مدى صلة اتساع المفهوم GLA!‏ الخاص بنا 
بصدق المحتوى. 

ومن الواضح. فإن المحتوى المبالغ فيه أكثر من اللازم أو المحتوى المختصر الأقل من 
اللازم يمكن أن يثير مشاكل إذا دى إلى وجود عدم تطابق بين المفهوم الذي يراد من اممقياس 
قياسه ونطاق البنود التي يحتوي عليها. في سياق الاختبارات التعليمية» حذر ”ميسيك“ 
Messick (1995)‏ من المخاطر المحتملة ل ”سوء أو نقص تمثيل المفهوم“» أي أخذ عينات 
محدودة جداً من مجال ونطاق «sg tock!‏ وبالتالي من المحتمل أن يحرم أحد ا ممتحنين 
من فرصة إثبات وإظهار معرفته أو معرفتها. ومع US‏ يشير أيضاً إلى خطر ”التباين غير 
الملائم للمفهوم البنائي“ الذي Xe‏ أن ينتج عن أخذ عينات من المحتوى على نطاق واسع 
جداً. على الرغم من أن ”ميسيك“ يناقش هاتين الظاهرتين على أنهما تهديد للصدق البنائي» 
إلا أنهما تتعلقان بوضوح باتساع نطاق اختيار المحتوى Jbg‏ صدق المحتوى. 

وعلى الرغم من أن إستراتيجية اختيار عينة المحتوى والتي تكون إما مفرطة في الشمول 
أو شديدة التقيبد يمكن أن تمثل إشكاليةء ويبدو أن هناك glis‏ أو عدم تناسق» مع وجود 
مفاهيم بنائية أوسع نطاقاً ومجموعات بنود أكثر شمولاً. ومن مظاهر هذا الاتجاه أنه يبدو 
في بعض السياقات البحثيةء أن هناك تفضيلاً متزايداً لمقاييس القياس GIS‏ الأهداف العريضة 
أو التي تكون على نطاق واسع. والقياس المتعلق بالحالة الصحية هو مثال على ذلك. 
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ومن الواضح أن هناك بعض الأسباب التي تقف وراء هذا التفضيل المتزايد للمقاييس 
الأكثر شمولاً. إذا كان المقياس يمكن أن يغطي dow‏ واسعة Goud‏ فمن المحتمل أن يكون 
أكثر فائدة واستخداماً. ويمكن لشخص أن يقولء على سبيل OL JELI‏ مقياساً عاماً للإعاقة 
قد يكون أكثر جاذبية من مقياس خاص بمجموعة معينة من ال مرضى. وهذا لا يغني عن 
الحاجة إلى وضع وتطوير مقياس جديد لكل نوع من الأمراض اممختلفة فحسب» بل إنه 
يعزز المقارنات بين المجموعات GY‏ يمكن قياس كليهما باستخدام نفس الأداة. وعلاوة على 
LS‏ فإن أدوات القياس الأكثر قابلية للتطبيق يمكن أن تؤدي dago‏ أو وظيفة مزدوجة, 
وهي تلبية الاحتياجات الإدارية فضلاً عن الاحتياجات البحثية. ولأغراض مثل تلبية 
ومعالجة حقوق ومطالبات الإعاقة, على سبيل JEL‏ هكن تطبيق أداة أكثر عمومية بشكل 
موحد لقياس الإعاقة عبر الظروف (الحالات) ومن ثم تحديد الأهلية للحصول على تعويض 
بطريقة موحدة بين ال مرضى والسياقات (الحالات). MIS‏ قد تستفيد مقارنات فعالية 
العلاج عندما يتم قياس نتائج العلاج بنفس الأداة. ومع ذلكء قد تخفي هذه Lik!‏ الظاهرة 
أهمية الاختلافات السياقية والعينات المحددة في طريقة أداء المقياس. 
وكما هو الحال LW dub‏ فإن الصدق ليس خاصية متأصلة في أداة القياس بل هو 
خاصية لأداة القياس في سياق استخدامها. قد تكون الأداة صادقة في سياق واحد ولكنها 
غير صادقة في سياق آخر أو عند استخدامها بشكل مختلف. كمثال واضح للغاية أو بديهي 
على Wd‏ فإن جهاز ضغط الدم في le‏ عمل جيدة هو وسيلة Bolo‏ لتقييم الضغط في 
الأوعية الدموية للشخص؛ ومع US‏ إذا تم وضع الجهاز حول رأس شخص ما في محاولة 
لقياس ذكائه» فإن النتيجة لن تكون صحيحة أو صادقة. لا يوجد الصدق في الأداة نفسها 
ولكن في LAs‏ وطريقة استخدامها. وينطبق هذا أيضًا على المقاييس في القياس القائم 
على البنود. My‏ فإن صدق محتوى أداة ما سيعتمد أو يتوقف على مدى جودة وسلامة 
البنود التي تتألف منها خريطة المقياس للمفهوم البنائي موضع الاهتمام للمجتمع الإحصائي 
وسياق البحث المحدد. وسيؤثر تنوع محتوى البند على خريطة العمل هذه. 
يتمثل أحد أوجه القصور ال محتملة في الأداة التي تحاول قياس مفهوم ما على نطاق 
واسع في أن البنود التي تم اختيارها لتمثيل وتجسيد هذا المفهوم قد لا تنطبق بالتساوي في 
جميع المواقف والحالات أو على كل المجتمع الإحصاي. في الواقع» قد يكون صدق المحتوى 
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للأداة معتمداً إلى حد كبير على السياق. لنفكرء على سبيل JELI‏ أداة افتراضية تهدف إلى 
تقييم (قياس) الوعي بالتكاليف. ولأغراض تدريبية أو تعليميةء دعونا نفترض أن الأعمال 
السابقة قد كشفت عن أن بعض الأفراد مدركون بدرجة عالية للتكلفة عند إجراء عمليات 
الشراء. سوف gig‏ هؤلاء الأفراد عن إجراء عملية cel pill‏ حتى لو كانت السلع ال معروضة 
جذابة GLU‏ إذا كانوا يعتقدون أن التكلفة لا تمثل dod‏ استثنائية. ولنفترض WIS‏ أن 
اشخاصاً آخرين كان وعيهم أقل متغير التكلفة. بالنسبة لهؤلاء الأفراد. فإن التكلفة ليست 
Mole‏ محدداً رئيسياً في قراراتهم المتعلقة بالشراء ولكنها ليست سوى واحدة من Bus‏ 
اعتبارات مهمة تشمل الجودة والرغبة. وإذا كانت سلعة معينة من السلع الاستهلاكية 
جذابة للغاية بالنسبة لهم» فقد يفضلون الحصول عليها عندما تتاح الفرصة نفسها بدلاً من 
انتظار إمكانية العثور على سعر أقل لنفس السلعة أو المماثلة لها في أماكن أخرى. 

ومع الاستمرار في هذا JELI‏ الافتراضي» دعونا نفترض أن الباحث يريد تكوين مقياس 
لتقييم الوعي بالتكاليف على النحو المبين هنا. قد يحقق ذلك من خلال التفكير بعناية 
حول ما يشمله ا مفهوم ثم تطوير البنود التي تعكس ذلك التعريف العملي للمفهوم. 

ومن المسائل أو القضايا التي سيواجهها الباحث مدى اتساع أو ضيق نطاق قرارات 
الشراء التي ينبغي أن تتضمنها وتشملها الأداة. وهذاء بدورهء ينبغي أن يتم الاسترشاد به 
في تكوين slog‏ البنود. وفي إحدى الحالات المتطرفة. يمكن تركيز البنود بشكل محكم إلى 
حد ما على خيارات شراء محددة. مثل شراء سيارة جديدة. وعلى النقيض من EUS‏ مكن 
للباحث أن يحاول وضع مقياس عام يمكن تطبيقه على أي نوع من الحالات التي قد تكون 
فيها التكلفة قضية أو مشكلةء ما في ذلك مجموعة كبيرة من السلع والخدمات. دعونا ننظر 
في بعض الأمثلة على أنواع البنود التي قد يسفر عنها كل نهج من هذين النهجين. افترض أن 
مجموعتي البنود التاليتين طلبتا من المجيبين الموافقة على كل بند على مقياس اتفاق مكون 
من ست نقاط مع خيارات استجابة تتراوح بين لا أوافق بشدة إلى أوافق بشدة. البنود أرقام 
١‏ و" Yg‏ التالية تخص الوعي بالتكلفة في سياق شراء سيارة. 


-y‏ أفضل تأجيل الحصول على السيارة التي أريدها حقاً بدلاً من دفع بنس واحد زيادة لذلك. 


-y‏ أفضل أن أدفع أكثر قليلاً وأحصل على السيارة التي أريدها بالضبط بدلاً من توفير بعض 
ا مال ولكن يجب المساومة. 
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-Y‏ أنا أعتبر السعر الأول الذي يذكره مندوب مبيعات السيارات ليس أكثر من حيلة مساومة. 
وتتضمن المجموعة الثانية من البنود (أي من البند رقم ٤‏ إلى البند رقم 1( نسخة dole‏ 
من المجموعة الأولى» وصيغت لتكون AL‏ للتطبيق عبر السياقات ا مختلفة. 
€- أنا أفضل تأجيل امتلاك ما أريده حقاً Vu‏ من دفع بنس واحد أكثر لذلك مما يجب 
-o‏ أفضل أن أدفع أكثر قليلاً وأحصل على السلع أو الخدمات التي أريدها بالضبط بدلاً من 
توفير بعض امال ولكن يجب المساومة. 
3- أنا أعتبر أن السعر الأول المذكور GY‏ سلع أو خدمات ليس أكثر من حيلة مساومة. 
ويبدو أن البنود الثلاثة الأولى تستفيد من الوعي بالتكلفة وتتشارك في وجهة نظر معينة 
حول أسعار السيارات وأهميتها في اتخاذ خيارات شراء السيارات. قد يوافق بعض الناس 
بشدة أو لا يوافقون على العبارات بصيغتها المكتوبة» ولكن ليس من الصعب أن نتصور أن 
الاستجابات التي اختارها شخص ما ستكون متشابهة إلى حد ما عبر مختلف حالات شراء 
السيارات. كما يبدو من ال معقول أن تنطبق هذه البنود بشكل أو بآخر بنفس الطريقة 
تقريباً على غالبية الأشخاص QU!‏ يواجهون قرار شراء سيارة. وعلى الرغم من أن مدى 
تأيبد مختلف الناس للفقرات من شأنه أن يختلف على الأرجح اختلافاً dS‏ إلا أنني أتوقع 
درجة عالية نسبياً من الاتساق في مستويات الموافقة التي يقدمها أي شخص. 
دعونا الآن ننتقل إلى العبارات الثلاث ا متبقيةء أي البنود من رقم إلى رقم 7. وليس من 
الصعب تصور أن مجال المتغير الأوسع نطاقاً (أي النطاق الشاملء وليس المحدد بالسياق 
للوعي بالتكلفة) وما يرتبط به من بنود قد يسبب بعض الصعوبات. ولا أتوقع أن يتفق 
معظم الناس على هذه البنود على نحو مماثل عبر سياقات مختلفة بشكل ملحوظ. على 
سبيل ال مثال» ينبغي النظر في LAS‏ استجابة الناس على هذه البنود في ثلاث حالات أو مواقف 
مختلفة: (أ) شراء تلفزيونء (O)‏ شراء عمل أو فن ob‏ (ج) تقرير ما إذا كان ينبغي تلقي 
المشورة القانونية أو التخلي عنها في مسألة ذات أهمية حيوية. وإنني أشك بشدة في أن 
هذه السياقات المختلفة ستحسن علاقة هذه البنود مع متغيرها الكامن المقصود منهاء 
وأن معرفة كيفية استجابة شخص ما في أحد تلك السياقات لن تكون بالضرورة تنبؤيه 
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لكيفية استجابته للسياقين الآخرين. وأساس هذا الشك هو اعتقادي بأن الوعي بالتكلفة 
كما تعكسه هذه البنود الأخيرة له معنى مختلف اختلافاً جوهرياً في سياقات مختلفة. 
وأهميته بالنسبة للمتغيرات الأخرى التي تؤثر على الاستجابات للبنود تكون غير متسقة. 
ويبدو أن الوعي بالتكلفة الذي يحفز المساومة (التفاوض) على تكلفة المشورة القانونية 
التي قد تؤدي إلى بعض العواقب الخطيرة مثل السجن أو الخسارة الكاملة لأصول المرء هو 
متغير مختلف تماماً عن المتغير الذي ينطوي عليه التفاوض والمساومة حول سعر تلفزيون 
جديد. وإذا أكدت الأدلة التجريبية هذه الشكوكء فإنني سأقول إن المجموعة الثانية من 
البنود الأكثر عمومية لم تكن GIS‏ مضمون صحيح عبر السياقات. وعلاوة على EUS‏ أود 
أن أقترح أن عدم صدق الأدلة في سياقات معينة (مثل تحديد الخيارات المتعلقة بالحصول 
على مساعدة قانونية أو طبية Lig (dole‏ على الأقل diye‏ عن عدم خصوصية وتحديد 
ا مفهوم البنائي. ونتيجة لهذا النقص في التحديد. قد يتعرض صدق محتوى البنود من البند 
رقم E‏ إلى البند رقم ١‏ للخطر. 

وبطبيعة led!‏ هكن للمرء أن يجادل GL‏ البنود من البند الأول إلى البند الثالث 
ستكون أيضًا محتوى غير صالح في مواقف أو OVE‏ أخرى غير شراء سيارة. eg‏ الرغم من 
أن هذا صحيح بلا شكء إلا أن الفرق المهم هو أن القيد في صدق محتوى تلك البنود واضح» 
وأن الأشخاص العقلانيين لن يحاولوا استخدامها لتقييم الوعي بالتكلفة في سياقات مختلفة 
بشكل ملحوظ. ومع ذلكء في حالة وجود البنود الأكثر عمومية» فإن عدم ملاءمتها لبعض 
المواقف يكون أقل وضوحًا ويممكن بسهولة ألا يلاحظه أحد. 

في المثال السابقء كان صدق المحتوى معرضاً للخطر عندما تم استخدام نسخ أكثر 
عمومية من البنود OY‏ مفهوم الوعي بالتكلفة يأخذ في الأساس معنى مختلقًا في بعض 
السياقات. وثمة طريقة أخرى يتم من خلالها تعريف أوسع نطاقاً للمفهوم البنائي رها 
يعرض Guo‏ المحتوى للخطر وهي عندما تكون مجموعة فرعية من البنود SIS‏ صلة 
با مفهوم البنائي أحيانًا وأحيانًا لا تكون WIS‏ وهذا يعني» أنه في بعض الظروف» ستكون 
بعض البنود مصدرًا لحدوث تباين غير ذي ilo‏ با مفهوم البنائي (ميسك. 1995 (Messick,‏ 
حتى Louis‏ تحتفظ بنود أخرى بصلتها وأهميتها. وكمثال افتراضي آخرء ضع في اعتبارك 


مجموعة فرعية من البنود قيد النظر لمقياس عام للإعاقة. (مرة أخرىء يمكننا أن نفترض أن 
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خيارات الاستجابة المصاحبة تتراوح من لا أوافق بشدة إلى أوافق بشدة). 
أ - لدي مشكلة في استخدام يدي للمهام التي تتطلب قوة قبضة. 
ب- لدي مشكلة في الوقوف من وضعية الجلوس. 
ج - عندما أبقى في وضع واحد لفترة طويلة olè dus‏ أطرافي تصبح صلبة متيبسة. 
د - أنا أتعب بسهولة عندما أبذل lage‏ كبيراً Jae‏ 
ه - م يعد بإمكاني القيام بأشياء كان بإمكاني القيام بها بسهولة. 

يمثل كل بند من هذه البنود قيداً وظيفياً هكن أن يعتبر ممثلاً للإعاقة بصورة منطقية. 
وبالنسبة لبعض أنواع المرض» قد يتوقع أن تكون كلها مظاهر للحالة وقد تميل إلى أن تحدث 
في انسجام. غير أن هناك مشكلة تنشأ إذا كان الغرض من البنود هو تقييم الإعاقة بالنسبة 
لحالة لا تتضمن كل هذه القيود. وف مثل هذه الحالة. قد تكون بعض البنود تتمتع بصدق 
المحتوى في حين أن البعض الآخر ليس كذلك. UU‏ على سبيل المثالء بالنسبة لشخص 
يعاني من كسر حاد في الساقء فإن البند رقم «أ» والذي يصف عدم وجود قوة القبضة 
سيكون بنداً لا يتمتع بصدق المحتوى. أي إن قوة القبضة ستكون غير مفيدة فيما يتعلق 
بتأثر كسر ساق الشخص. ف المقابلء بالنسبة لبعض الحالات الأخرىء رها السكتة الدماغية 
أو التهاب المفاصل الروماتويديء ob‏ بنداً عن قوة القبضة قد يتمتع بصدق المحتوى. 
لذلكء في حين أن إدراج وتضمين البند رقم «أ» يضر بصدق المحتوى لمن يعاني من ساقة 
المكسورة. فإن حذفه أو إهماله قد يضعف صدق المحتوى للمريض الذي gle‏ من التهاب 
المفاصل الروماتويدي. وتكمن الصعوبة هنا في أن التعريف الإجرائي الضمني للإعاقة الذي 
اعتمدته عند تكوين هذه البنود التوضيحية كان فضفاضاً وواسعاً أكثر مما Au‏ ونتيجة 
cU‏ وضعت قائمة بمظاهر الإعاقة المقبولة التي قد تظهر في مجموعة من الحالات الحادة 
أو المزمنة دون مراعاة للكيفية التي يمكن أن تناسب هذه القائمة. أي حالة محددة تؤدي 
إلى الإعاقة. ومن ثم» فإن التعريف الأوسع نطاقاً يؤدي مرة أخرى إلى نشوء De‏ هكن أن 
تضر بصدق ال محتوى. 

تم وضع الأمثلة السابقة لتوضيح وإثارة نقطة. وإنني أشك في أن أي شخص سيفكر فعلياً 
في وضع وتطوير مقياس للوعي بالتكلفة مع فكرة أنه مكن استخدام بنود مثل البنود من 
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البند الرابع إلى البند السادس في أي سياق دون عقاب (مخاطرة). كما أن أي باحث خبير 
(ذي خبرة) لن يجمع بين البنود من البند الأول إلى البند الخامس في مقياس واحد يهدف إلى 
تقييم الإعاقة عبر مجموعة واسعة من الظروف والحالات. ومع US‏ توضح هذه الأمثلة 
ا متطرفة نقطة تنطبق في بعض حالات القياس في العام الحقيقي أو من واقع الحياة: عندما 
يكون المتغير والمقياس المراد استخدامه ذو نطاق واسع للغايةء يزداد احتمال عدم تطبيق 
بعض ال مؤشرات (وبالتالي لن يكون له صدق محتوى) في حالات معينة أو مجموعات معينة. 

ومن النتائج السلبية الأخرى المحتملة لتعريف متغير ما على Glas‏ واسع أن خطوات 
OLY‏ صدق المحتوى قد يصبح أكثر عبثاً وإرهاقاً. فعلى سبيل المثالء كما هو موضح 
في الفصل الخامسء من الشائع أن يطلب من الخبراء مراجعة محتوى البنود كوسيلة 
لضمان صدق المحتوى. ومع اتساع نطاق المفهوم GLI‏ قد تحتاج أيضاً الخبرة الجماعية 
للأشخاص الذين lb‏ منهم مراجعة Gro‏ المحتوى إلى التوسع. كما أن المهمة ا معروضة 
على هؤلاء الخبراء قد تصبح أكثر صعوبة لأن هؤلاء المحكمين يضطرون إلى النظر في متى 
قد يكون بند معين ذا صلة بالمفهوم البنائي أو لا يكون له alo‏ وهذا يتطلب أن يتصوروا 
أو يتخيلوا شيئاً ما يقترب من جميع الحالات وا مواقف الممكنة التي يمكن فيها استخدام 
الأداة وتقييم مدى ملاءمته لكل منهما - وهو مهمة وعمل هائل. ومع تناقص خصوصية 
المفهوم البنائي بدقة. قد يجد المحكمون صعوبة أكبر في تقييم ما إذا كانت هناك بنود 
محددة تناسب المفهوم البنائي على نحو BIS‏ وقد يتطلب ذلك إنشاء فريق من المحكمين 
الخبراء أكبر مما يلزم مع تحديد أكثر دقة للمفهوم البنائي لتحقيق نفس الدرجة من الثقة 
ي تقديراتهم وتقييماتهم. 

وعندما تتعلق أسئلة البحث GIS‏ الاهتمام بمتغيرات واسعة النطاق بطبيعتهاء قد يفكر 
الباحثون lod‏ إذا كان مقياس عام واحد أو مقاييس محددة متعددة تكون أكثر ملاءمة 
للمهمة وأكثر ملاءمة لإثبات صدق المحتوى. ومواصلةً لمثال الوعي بالتكاليف» قد يفكر 
الباحث فيما إذا كانت عدة مقاييس خاصة بسياقاتها الفريدة من نوعها ستكون بديلاً أكثر 
فائدة لمجموعة غير محددة من البنود المماثلة ممجموعة البنود من البند الرابع إلى البند 
السادس السابق ذكرها. أو قد يكون من المفيدء في حالة مقياس Aley]‏ اختيار مجموعات 
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البنود التي تشير تحديداً إلى أنواع القيود التي يمكن توقعها بين مجموعة محددة بشكل 
ضيق للغاية من الناس. 

يختلف صدق المحتوى عن الأنواع الأخرى من الصدق التي سنناقش ها لأنه يُعرّف فعلياً 
بالإجراءات التي يتخذها منشئ أو مبتكر المقياس في بداية تطوير المقياس. وأهم هذه 
العوامل هو النظر بعناية في المتغير الذي يقصد من المقياس أن يقيسه ومن ثم أنواع البنود 
التي تكون عينات كافية من المجال أو النطاق الذي يتضمنه المتغير. وتستحق المفاضلات 
بين النطاقات الأكثر عمومية والنطاقات الأكثر تحديداً ومجموعات البنود اهتماماً دقيقاً في 
هذه المرحلة من عملية تطوير ا لمقياس وکن أن يكون لها تأثير كبير على صدق محتوى 
البنود التي تم اختيارها في نهاية الممطاف. وبالمثل» ينبغي toll‏ عند اختيار مقياس 
موجود بالفعل لاستخدامه في دراسة ماء بدلاً من مجرد الاعتماد على التقارير السابقة 
المتعلقة بصدق المحتوى من الدراسات السابقةء أن يفكر بعناية في كيفية توافق أو تطابق 
محتوى المقاييس المتاحة مع المجتمع الإحصائي. والسياق» yards‏ أسئلة الدراسة المحددة 
التي تم التخطيط لها. 

ونظراً لأن اتساع المتغير الذي يختار الباحث دراسته يحدد بطريقة مباشرة وشفافة 
حجم المجموعة المحتملة من المحتوى الذي يجب أن lig‏ مطور المقياس بشكل مناسبء 
فقد فضلت مناقشة هذه القضية جنباً إلى جنب مع صدق المحتوى. ومع ذلكء فإن اتساع 


التي أناقشها في الجزء المتبقي من هذا الفصل. ولن أكرر ما قمت بتغطيته حتى الآن» ولكن 
يجب أن يدرك القراء أن ملاءمة ومناسبة البنود للمفهوم البنائي أمر بالغ الأهمية بالنسبة 
لجميع أنواع الصدق التي تم استعراضها في هذا الفصل. ومع اتساع حدود هذا المفهوم 
SLi‏ هكن أن تصبح مهمة إيجاد وإثبات الصدق الممرتبط بالمحك (بالمعايير) أو الصدق 
Glu!‏ أكثر صعوبة» تماماً كما هو الحال بالنسبة لصدق ال محتوى. 
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الصدق المرتبط بمحك (معيار): 


من أجل الحصول على الصدق المرتبط بمحك أو glee‏ كما يوحي ال مصطلح. لا يشترط 
إلا أن يكون لبند أو مقياس ارتباط تجريبي ببعض المحكات أو ”المعيار الذهبي“ المفترض. 
وسواء قد تم فهم الأساس النظري لذلك الارتباط al‏ لاء فإن ذلك ليس له صله بالصدق 
ا مرتبط بالمعيار. على سبيل JELI‏ إذا تبين أن عملية التغطيس (البحث بعصا الاستنباء عن 
الماء) مرتبطة بشكل تجريبي بتحديد موقع مصادر المياه digo‏ فإن عملية التغطيس 
ستكون Bolo‏ فيما يتعلق بمعيار حفر الآبار بنجاح. وبالتاليء فإن الصدق المرتبط با محك 
في حد ذاته هو مسألة عملية (تطبيقية) أكثر من كونها مسألة علميةء لأنها ليست معنية 
بفهم العملية بل مجرد التنبؤ بها وتوقعها. وفي الواقع» غالباً ما يشار إلى الصدق المرتبط 
محك على أنه صدق تنبؤي „predictive validity‏ 

لا يعني الصدق المرتبط بمعيار تحت أي اسم بالضرورة وجود علاقة سببية بين ا متغيرات» 
i>‏ عندما يكون الترتيب الزمني للتنبؤ وال معيار واضح لا لبس فيه. وبطبيعة الحالء قد 
يكون التنبؤ في سياق النظرية (مثل التنبؤ كفرضية) ذا Abo‏ بالعلاقات السببية بين المتغيرات 
ويمكن أن يخدم أو يؤدي غرضًا Gale‏ مفيدًا. 

day‏ نقطة أخرى جديرة بالملاحظة بشأن الصدق المرتبط بمعيار. هي أن المرء» من 
الناحية المنطقية» يتناول نفس نوع قضية الصدق سواء كان المعيار يتبع أو يسبق أو يتزامن 
مع القياس المعني. وهكذاء بالإضافة إلى الصدق التنبؤيء فإن الصدق المتزامن أو التلازمي 
concurrent validity‏ (على سبيل JELI‏ التنبق مهارة القيادة من الإجابات على الأسئلة 
الشفوية التي طرحت في اختبار القيادة) أو حتى الصدق اللاحق postdictive validity‏ 
(على سبيل JELI‏ التنبق بالوزن عند الولادة من مقياس gal Mle‏ للطفل الرضيع) يمكن 
استخدامها بشكل مترادف إلى حد ما مع الصدق المرتبط محك أو معيار. وأهم جانب 
من جوانب الصدق المرتبط بمحك أو معيار ليس العلاقة الزمنية بين المقياس ا معني (الذي 
يراد التثبت من صدقه) وا معيار الذي يحاول امرء استنتاجه من dins‏ بل هو قوة العلاقة 
التجريبية بين الحدثين. ويتمتع الصدق المرتبط محك بميزة مقارنة بالمصطلحات الأخرى 
تتمثل في كونه محايداً زمنياًء وبالتالي فهو الأفضل. 


۲ تطوير المقاييس: النظرية والتطبيق 


الصدق 


الصدق المرتبط بمحك مقابل الدقة: 

وقبل الانتهاء من مناقشة الصدق اممرتبط محك» هناك بضع كلمات تتعلق بعلاقته 
بالدقة. وكما يشير «غيسيلي وآخرون )1981( Ghiselli et al.‏ فإن معامل الارتباط, 
الذي كان المؤشر التقليدي Gua‏ المرتبط بمحكء قد لا يكون مفيداً للغاية عندما تكون 
الدقة التنبؤية هي القضية أو المسألة. فعلى سبيل JELI‏ لا يكشف معامل الارتباط عن 
عدد الحالات التي يتم تصنيفها بشكل صحيح من قبل أحد المؤشرات (على الرغم من أن 
الجداول التي تقدم تقديرًا لنسبة الحالات التي تقع في فئات مئوية مختلفة» استنادًا إلى 
حجم الارتباط بين المنبئ والمعيارء تم وصفها من قبل”غيسيلي وآخرون". ص .)۳١١‏ وقد 
يكون من الأنسب في بعض الحالات تقسيم كل من المتنبئ ومعياره إلى فثات منفصلة 
وتقييم ”معدل الدخول“ لحالات الاستبدال إلى الفئة الصحيحة للمعيار استنادا إلى فئة 
التنبؤ الخاصة بهم. فعلى سبيل المثالء يمكن تصنيف كل متغير إلى فئات «منخفضة» مقابل 
«عالية» كما يمكن تصور الدقة على أنها نسبة التصنيفات الصحيحة (أي الحالات التي 
تتطابق فيها dod‏ ا مؤشر مع قيمة المعيار). حيث إن تقسيم الشخص للفئات هو اعتبار 
مهم. لنأخذ في الاعتبار معياراً أو محكاً له حالتان غير تعسفيتين» مثل «مريض» و«صحيح 
أو «glee‏ وأداة تقييم تحتوي على مجموعة من الدرجات التي يريد المحقق تقسيمها. 
والغرض من أداة التقييم هو التنبؤ بما إذا كان الأفخاص سيختبرون على أنهم إما موجب 
أو سالب بالنسبة للمرض موضع الاهتمام. ونظرًا OY‏ النتيجة ستكون ثنائية الاستجابة 
فمن المنطقي أن يكون المتنبئ ثنائي. هناك خطآن محتملان في التصنيف هما: يمكن أن 
iuas‏ المقياس عن طريق الخطأ شخصًا مريضًا حقاً على أنه صحيح (سليم) (نتيجة سلبية 
زائفة أو خاطئة) أو شخصًا صحيحاً É>‏ على أنه مريض (نتيجة إيجابية زائفة أو خاطئة). 

حيث بممكن أن يؤثر التقسيم على معدلات هذين النوعين من الأخطاء على امتداد 
نطاق الدرجات من أداة التقييم. في النهايات» سيؤدي تصنيف كل شخص على أنه صحيح 
إلى تجنب أي سلبيات خاطئة أو زائفة (ولكن يزيد من الإيجابيات الزائفة) بينما يؤدي 
تصنيف كل شخص على أنه مريض إلى تجنب أي إيجابيات زائفة (ولكن يزيد من السلبيات 
الزائفة). ومن الواضح. في WS‏ الحالتين المتطرفتينء أن أداة التقييم لن تكون لها أي قيمة 
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تنبؤيه على الإطلاق. والهدفء بالطبع» هو اختيار نقطة القطع التي ينتج عنها أقل عدد من 
الأخطاء من أي نوع وبالتالي أعلى درجة دقة. وفي كثير من الأحيانء لا توجد نقطة قطع 
مثالية gl)‏ نقطة قطع واحدة تؤدي إلى تصنيف مثالي). وفي مثل هذه الحالةء قد يبذل 
الباحث مجهودًا واعياً لتقليل نوع واحد من الأخطاء إلى الحد الأدنى بدلاً من الآخر. فعلى 
سبيل JEI‏ إذا كان yoy bl‏ مدمراً وكان العلاج Vlad‏ وغير مكلف وغير مضرء OB‏ تكلفة 
نتيجة سلبية زائفة (تؤدي إلى التفريط في العلاج) أكبر بكثير من تكلفة نتيجة إيجابية زائفة 
(تؤدي إلى الإفراط في العلاج). وبالتاليء فإن اختيار نقطة قطع لتقليل السلبيات الزائفة مع 
قبول إيجابيات زائفة يبدو مناسباً. ومن Leb‏ أخرىء إذا كان العلاج ÉK‏ ومزعجاً «كريهاً» 
في آن واحد وإذا كان المرض خفيقًا أو معتدلاًء فقد تكون ا مفاضلة العكسية أكثر منطقية. 

Lai‏ من المهم أن نتذكر أنه حتى لو كان الارتباط بين مقياس التنبؤ وا معيار Lali‏ فإن 
النتيجة التي تم الحصول عليها في مقياس التنبؤ ليست تقديراً للمعيار أو المحك. معاملات 
الارتباط غير حساسة للتحولات الخطية لأحد المتغيرين أو كليهما. ويشير الارتباط المرتفع 
بين متغيرين على أن الدرجات على هذين المتغيرين والتي تم الحصول عليها من نفس 
الشخص سوف تشغل مواقع مماثلة في توزيعات كل logio‏ على سبيل SUE!‏ شخص ما 
يسجل درجات عالية Tue‏ على المتغير الأول من ال محتمل أيضاً أن يسجل درجات عالية 
Tae‏ على المتغير الثاني إذا كان الاثنان مرتبطين بشدة. ومع EUS‏ فإن التعبير «عالية das‏ 
هو مصطلح نسبي وليس مصطلحاً مطلقاً ولا يأخذ في الاعتبار Grog‏ القياس الخاصة 
بالمتغيرين» على سبيل SL!‏ وقد يكون من الضروري تحويل وحدات قياس مقياس التنبؤ 
إلى وحدات القياس الخاصة بالمعيار للحصول على تنبؤ رقمي أو كمي دقيق. وهذا التعديل 
Joles‏ أو يساوي تحديد القاطع intercept‏ المناسب بالإضافة إلى ميل خط الانحدار. ويمكن 
أن يؤدي عدم إدراك الحاجة إلى تحويل درجة ما إلى استنتاجات خاطئة. ومن المحتمل 
حدوث خطأ من هذا النوع على الأرجح إذا حدث أن تمت معايرة مقياس التنبؤ في وحدات 
تقع في نفس نطاق المعيار. افترضء على سبيل JE‏ أن شخصاً ما وضع «مقياس مخالفة 
السرعة» التالي وذلك للتنبؤ بعدد تذاكر مخالفة السرعة التي سيحصل عليها السائقون على 
مدى خمس سنوات: 
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-١‏ أنا أتجاوز الحد الأقصى للسرعة عندما أقود السيارة. 

Jai dob ILo 435)‏ 
-Y‏ على الطرق متعددة اممسارات» وأنا أقود سيارق أتجاوز ob!‏ العابر. 

(كثيراًء job blo‏ أبداً). 
-Y‏ آنا أحكم بنفسي على ما هي سرعة القيادة المناسبة. 

(كثيراًء job blo‏ أبداً). 

ولنفترض أيضًا افتراضاً غير منطقي ob‏ المقياس يرتبط ارتباطاً Lob‏ بعدد تذاكر مخالفة 
de pull‏ التي تم الحصول عليها خلال فترة خمس سنوات. يتم تسجيل ال مقياس عن طريق 
إعطاء كل بند القيمة (Y)‏ عندما يختار ا مجيب الاستجابة «كثيرا» والقيمة (Y)‏ للاستجابة 
«أحيانا» والقيمة )1( للاستجابة «نادرًا» والقيمة (صفر) للاستجابة «أبدًا». ثم يتم جمع 
درجات البنود للحصول على درجة المقياس. درجة صدق المعيار الكاملة لا تعني أن الدرجة 
البالغة تسع درجات تشور إلى الحصول على تسع تذاكر مخالفة للسرعة على مدار خمس 
سنوات» بل يعني هذا أن الأشخاص الذين يسجلون أعلى الدرجات على الأداة هم Las)‏ 
الأفخاص الذين لديهم SÍ‏ عدد من تذاكر مخالفة السرعة في السنة. ومن شأن بعض 
عمليات التحويل المحددة تجريبياً ٠,۳۳ Mee)‏ * الدرجة) أن تسفر عن التقدير الفعلي. من 
شأن هذا التحويل seb!‏ أن يتنبا بثلاث بطاقات للسائق الذي حصل على تسع درجات. 
وكلما زاد الصدق المرتبط lng‏ كان التقدير أكثر دقة استناداً إلى مقياس التنبؤ. ومع ذلك 
فإن التشابه بين القيم العددية للمعيار ومقياس التنبؤ قبل القيام بعملية تحويل مناسبة 
لن تكون له أي علاقة بدرجة الصدق. 


الصدق البنائي (صدق التكوين الفرضي): 

إن الصدق GES‏ كما أشار كرونباخ وميهل )1955( Cronbach & Meehl‏ يُعنى 
مباشرة BIL‏ النظرية ممتغير (على سبيل SLU‏ درجة على مقياس ما) بمتغيرات أخرى. 
وهو المدى الذي يتصرف (يسلك) فيه المقياس بالطريقة التي يفترض أن يسلكها المفهوم 
البنائي الذي يستهدف قياسه فيما يتعلق ببناء المقاييس للمفاهيم البنائية الأخرى. 
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لذلك على سبيل المثالء إذا نظرنا إلى متغير معين» استنادًا إلى النظريةء على أنه مرتبط 
إيجاباً بالمفهومين البنائيين A‏ و8 ويرتبط Glu‏ بالمفهومين البنائيين © Dg‏ وغير مرتبط 
با مفهومين البنائيّين × Yo‏ فإن المقياس الذي يهدف إلى قياس ذلك المفهوم GLAD‏ يجب 
أن تكون له علاقة مماثلة لمقاييس تلك المفاهيم البنائية الأخرى. وبعبارة آخرى» يجب أن 
يرتبط مقياسنا بشكل إيجابي مع مقاييس المفهومين البنائيّين A‏ و8 ومرتبطًا Glu‏ مقاييس 
ا مفهومين البنائيّين Dg C‏ وغير مرتبط بمقاييس المفهومين البنائيّين × ولا. ويمكن التعبير 
عن هذه العلاقات الافتراضية كما في المخطط في الشكل رقم .)١1-6(‏ 


ويوفر مدى تطابق الارتباطات التجريبية مع النموذج المتوقع بعض الأدلة على مدى 
تصرف أو أداء المقياس كما يفعل المتغير المفترض أن يقيسه. 

وبتطبيق هذا النهج العام وصف ”ستيربا وآخرون“ )2007( lag Sterba et al.‏ من 
الارتباطات التي تنبأوا بأن تكون لأداتهم مع عدة مفاهيم بنائية ذات صلة. على سبيل 
JULI‏ استناداً إلى تحليلهم النظريء توقعوا أن ترتبط درجات الفعالية الزوجية مع مقاييس 
الجودة الزوجية» والتكيف gu All‏ ومعايير العمل الجماعي. وقد حددت بعض هذه 
التوقعات وجود ارتباطات dw‏ مثل العلاقة العكسية المفترضة بين الفعالية الزوجية 
والاكتئاب. وكان أحد القيود على تلك الدراسة» التي أقرها المؤلفون» أن الفعالية الذاتية 
الفردية 6 يتم تقييمها. إن إثبات أن الفعالية الزوجية تختلف عن تصورات الكفاءة الذاتية 
الفردية للشركاء داخل الأزواج ud couples‏ جانباً مهماً محتملاً في عملية التحقق من 
صدق المقياس. 





[Variable + + = = 2 o ] 





شكل :)١-٤(‏ علاقة افتراضية بين متغيرات 


التمييز بين الصدق البنائى والصدق المرتبط بمحك: 
be We‏ يخلط الناس بين الصدق البنائي والصدق المرتبط محك أو معيار وذلك بسبب 
أن الارتباط الدقيق نفسه يمكن أن يخدم كلا النوعين من الصدق. ويكمن الفرق في مقصد 
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وهدف الباحث أكثر مما يكمن في القيمة التي تم الحصول عليها. على سبيل SEL!‏ قد 
يحاول Glasi‏ الأوبئة تحديد أي من مجموعة متنوعة من المقاييس التي تم الحصول 
عليها في دراسة مسحية ترتبط بالحالة أو الوضع الصحي. وقد يكون القصد أو الهدف من 
ذلك هو مجرد تحديد عوامل الخطر دون أي قلق (على الأقل في البداية) للآليات السببية 
الأساسية التي تربط بين الدرجات على المقاييس والحالة الصحية. الصدقء في هذه الحالة 
هي الدرجة التي يمكن أن Lid‏ بها المقاييس بالحالة الصحية. وكبديل لذلكء هكن أن 
يكون الاهتمام هو النظرية والتفسير بشكل أكبر. وقد يؤيد old!‏ مثله Jis‏ أخصائي 
الأوبئة الذي تم وصفه في الفصل الافتتاحي من هذا الكتاب» نموذجًا نظريًا يعتبر الإجهاد 
سبباً في الحالة الصحية» وقد تكون المسألة هي مدى نجاح مقياس تم تطويره حديثاً في 
قياس الإجهاد. قد يتم تقييم ذلك من خلال تقييم سلوك المقياس بالنسبة للكيفية التي 
تشير النظرية في الكيفية التي يجب أن يعمل بها الإجهاد. إذا كانت النظرية تشير إلى 
ضرورة الارتباط بين حالة الإجهاد والحالة الصحيةء فيمكن استخدام نفس العلاقة التجريبية 
المستخدمة كدليل على الصدق التنبؤي في JEL‏ السابق كدليل على الصدق GES‏ 


وما يسمى بالتحقق من صدق المجموعات ال معروفة known-groups validation‏ هو 
مثال آخر على الإجراء الذي يمكن تصنيفه إما على أنه Gro‏ بنائي أو الصدق المرتبط lrg‏ 
Led‏ لنية وهدف الباحث. يتضمن التحقق من صدق ال مجموعات ال معروفة عادةً إثبات 
أن مقياس محدد هكن أن هيز أعضاء مجموعة واحدة عن أعضاء مجموعة أخرى بناءً 
على درجات المقياس الخاصة بهم. قد يكون الغرض إما النظرية ذات صلة (كما هو الحال 
عندما يتم التحقق من قياس الاتجاهات نحو مجموعة معينة عن طريق التمييز بشكل 
صحيح بين أولئك الذين ينتمون أو لا ينتمون إلى عضوية تلك المجموعة) أو التنبؤية البحتة 
LS)‏ هو الحال عندما يستخدم المرء مجموعة من البنود ليس لها علاقة على ما يبدو بالتنبؤ 
بترك الوظيفة). في الحالة الأولى» ينبغي اعتبار الإجراء نوعاً من الصدق Hid!‏ وقي الحالة 
الثانية» يكون الصدق هو الصدق المرتبط معيار أو محك. 


وبالإضافة إلى النية أو الهدف» هناك اختلاف آخر يكمن في كثير من الأحيان وراء الصدق 
ا مرتبط باممعيار والصدق البنائي. LYE‏ ما يتم تقييم الصدق ا مرتبط معيار مباشرةً عن 
طريق حساب ارتباط بين المقياس الذي يتم التحقق من صدقه والمعيار He)‏ سبيل JEL)‏ 
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بعض السلوكيات أو الحالة أو الدرجة). eg‏ النقيض من LIS‏ لا هكن تقييم الصدق 
البنائ إلا بصورة غير مباشرة (انظر لورد ونوفيك 278 (Lord & Novick, 2008, p.‏ 
OY‏ المقارنة GIS‏ الصلة تكون بمتغير كامن وليس متغير ملاحظ. وفي هذا oual‏ فإنه يشبه 
الثبات. وفي الفصول السابقةء لاحظنا أن OLII‏ يتعلق في الحقيقة بالعلاقة بين مؤشر ودرجة 
حقيقية لا يمكن ملاحظتهاء Lily‏ نستنتج تلك العلاقة على أساس الارتباطات بين المؤشرات 
التي يمكن ملاحظتها. وينطبق نفس الشيء على الصدق البنائي. حيث لا هكننا أن نحسب 
مباشرة الارتباط بين أداة القياس الذي يتم التحقق من صدقها والمتغير الكامن» ولكن يجب 
علينا أن نفعل ذلك بصورة غير مباشرة من خلال ملاحظة الارتباطات بين أداة القياس 
الجديدة والمؤشرات الأخرى الموثوق بها للمتغير الكامن. وف الواقع, قد يجد الباحثون أنه 
من المفيد استخدام هذا الاختلاف أو الفرق كقاعدة حسابية تقريبية عندما يكونون غير 
متأكدين مما إذا كان الصدق المرتبط shee‏ أو الصدق البنائي هو موضع الاهتمام الأساسي. 
إذا كان الهدف هو التنبؤ مخرجات أو نتائج يمكن ملاحظتها le)‏ سبيل SEL!‏ السلوك 
أو الحالة» أو الدرجة الملاحظة). فإن الصدق habl‏ معيار أو محك قد يكون هو الهدف. 
ومن ناحية أخرىء إذا كان الهدف هو التنبؤ بمستوى مفهوم بنائي افتراضيء لا يمكن ملاحظته 
عن طريق مؤشر يمكن ملاحظته» فمن ا مرجح أن يكون الهدف هو الصدق GES‏ 

ومع WS‏ في بعض Glo!‏ سيتضمن التحقق من الصدق اللرتبط بمعيار مؤشراً يُقصد 
به أن يعكس أو يظهر بعض الدرجات الحقيقية غير ا ملاحظة. liag‏ هو الحال عندما يكون 
المعيار (على سبيل JELI‏ خريج AUS‏ الحقوق المؤهل للقبول في نقابة ال محامين) LB‏ على 
شكل ما من أشكال التقييم النفسي (على سبيل JELI‏ اجتياز امتحان اللحاماة). إذا JB‏ 
هدف الباحث هو مجرد تنبؤ بدون تفصيل مفاهيمي» فإن مشثل هذه المقارنة هي مثال 
على الصدق المرتبط بمعيار على الرغم من عدم المقارنة بين المتنبئ والنتائج موضع الاهتمام. 


التخفيف (التضعيف) :Attenuation‏ 
إلى الحد أو القدر الذي يكون فيه مؤشران اثنان لا يتمتعان بالثبات التام» oL‏ أي ارتباط 


login‏ سوف Mi‏ من تقدير الارتباط بين الدرجات الحقيقية ALLI‏ لكل منهما (على 
سبيل JULI‏ لورد ونوفيك 2008 .(Lord & Novick,‏ وعندما نفترض أن الخطأ عشوائ» 
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فإنه لا يمكن الربط إلا بين الأجزاء التي تتمتع بالثبات من كل من ا مؤشرين فقط. Bling‏ 
على WHS‏ يضعف (ينخفض) معامل الصدق الملاحظ المحسوب بالربط بين متغيرين يمكن 
ملاحظتهما كنتيجة لأي عدم ثبات متأصل في تلك المؤشرات. ويمكن للشخص تطبيق 
تصحيح الضعف من علاقة ارتباط ملحوظ تأخذ في الاعتبار عدم ثبات المتغيرات. وينطوي 
هذا التصحيح على تقسيم الارتباط الملاحظ بين المؤشرين على الجذر التربيعي لحاصل ضرب 
ثبات كل منهم. وهكذاء 





حيث TD) yy‏ هي الارتباط بين الدرجات الحقيقية للمتغيرات × V9‏ و(ري:1) هي 
العلاقة بين الدرجات الملاحظة» (Tyy)s Myy)‏ هي ثبات المتغيرات × Vg‏ على التوالي. 

وعلى الرغم من توافر مثل هذه التصحيحات» فإن بعض ASL!‏ أو الكتاب يعارضون هذه 
التصحيحات. فعلى سبيل SUL)‏ يشير Jig”‏ وبيرنشتاين * (1994) Nunnally and Bernstein‏ 
إلى أنها قد تضلل الباحثين إلى الاعتقاد بأن الارتباط أقوى مما هو عليه في الواقع. كما يلاحظون 
أن المعاملات التي تم تصحيحها يمكن أن تتجاوز أحيانًا قيمة الواحد الصحيح (V+)‏ (ص 
(YOV‏ وهذا مثل مشكلة. ويشير لورد ونوفيك )2008( Lord and Novick‏ إلى أنه Louis‏ 
يتم التقليل من تقدير ثبات كل من المقياسين (والتي تحدث في مقام معادلة التصحيح)ء OS‏ 
الارتباط بين الدرجات الحقيقية سيكون مبالغاً في تقديره (ص 178). وبالإشارة إلى ما تم 
تناوله في الفصول السابقة من أنه وفقًا لنماذج أخرى غير الاختبارات المتكافئة, فإن معامل 
«ألفا» يكون تقديراً للحد الأدنى للثبات الحقيقي للمقياس» يصبح من الواضح أن ينشأ بسهولة 
«تصحيح» غير دقيق. وبالتالي» هناك حجج عملية قوية ضد استخدام التصحيح للتضعيف 
عند فحص الارتباطات» سواء من أجل تقييم الصدق أو لأغراض أخرى. وبسبب الطبيعة غير 
المباشرة لمعاملات الارتباط المستخدمة في تقييم الصدق GLI‏ كما تمت مناقشته في وقت 
سابق» فقد يكون من المغري بشكل خاص تصحيح معاملات الصدق من أجل التضعيف. ومع 
ذلك» لا تزال الحجج ضد تعديل التضعيف dihi‏ ومن ال ممارسات الشائعة عدم تصحيح 
معامل الارتباط في مثل هذه الحالات. 
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إلى أي مدى يجب أن تكون الارتباطات قوية لإظهار الصدق البنائي؟ 

Y‏ توجد نقطة قطع تحدد الصدق البنائي. ومن امهم أن ندرك أن هناك مقياسيين 
قد يتشاركان في أكثر من مفهوم SLs‏ متشابه. على وجه التحديد. فإن أوجه التشابه في 
الطريقة التي يتم بها قياس المفاهيم البنائية قد تفسر بعض التغاير في الدرجات المستقلة 
عن التشابه في المفهوم البنائي. على سبيل SEL‏ فإن متغيرين اثنين تم تسجيلهما على نظام 
تسجيل متعدد النقاط (الدرجات من ١‏ إلى )٠٠١‏ سيكون لهما ارتباط del‏ مع بعضهما 
البعض مقارنة بمتغير ثنائي» مع تساوي كل شيء آخر. وهذا يكون خادعاً بسبب هيكل أو 
بناء طرق القياس. وباممثل» HAs‏ للتشابه الإجرائيء قد ترتبط البيانات من نوع واحد تم 
جمعها عن طريق المقابلات بدرجة ما مع البيانات الأخرى التي تم جمعها بنفس الطريقة - 
أي إن بعض التغاير بين متغيرين قد يكون بسبب تشابه القياس بدلاً من تشابه المفهوم 
البنائي. وتوفر هذه الحقيقة الأساس للإجابة على السؤال المتعلق بحجم الارتباطات اللازمة 
لاستنتاج الصدق البنائي. وينبغي أن تظهر المتغيرات» كحد dol‏ التغاير أعلى وأكثر مما 
يممكن أن يعزى إلى تباين الطريقة المشتركة. 


مصفوفة الصفات المتعددة - الأساليب المتعددة Multitrait-‏ 
:Multimethod matrix‏ 


ابتكر «كامبل وفيسكي» )1959( Campbell and Fiske‏ إجراءً يسمى مصفوفة الصفات 
المتعددة - الأساليب امتعددة multitrait-multimethod matrix‏ التي تعد مفيدة للغاية 
لفحص ودراسة الصدق البنائي. ويتفق هذا النهج أو الطريقة تماماً مع الفكرة, التي تم 
تقديمها مسبقاء التي ترى أن الصدق GUI)‏ يتم تقييمه بصورة غير مباشرة ويجب الاستدلال 
عليه من المؤشرات doth!‏ للمتغير الكامن محل الاهتمام. وينطوي الإجراء على قياس 
أكثر من مفهوم Sly‏ واحد بأكثر من طريقة بحيث يتم الحصول على مصفوفة «متقاطعة 
elole‏ حسب مصفوفة القياس. على سبيل UL‏ لنفترض أنه قد تم تصميم دراسة ما يتم 
فيها قياس كل من القلق والاكتئاب ومقاس أو حجم الحذاء في مرتين منفصلتين باستخدام 
إجراءين قياسيّين مختلفين في كل مرة. (لاحظ أنه كان من الممكن قياس عينتين مختلفتين 
من الأفراد في نفس الوقت. ما هو تأثير ذلك على منطق النهج أو الطريقة؟) ويمكن تقييم 
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كل مفهوم بنائي بطريقتين: مقياس تناظري بصري hò)‏ أو phu‏ يضع عليه المجيبون علامة 
تشير إلى مقدار السمة التي هتلكونهاء سواء كانت القلق أو الاكتئاب أو كبر حجم القدم) 
وتصنيف معين من قبل الشخص الذي يجري ال مقابلة بعد ٠١‏ دقيقة من التفاعل مع كل 
موضوع. هكن للمرء بعد ذلك بناء مصفوفة من الارتباطات التي تم الحصول عليها بين 
القياسات كما هو Que‏ في الجدول رقم .)١-٤(‏ 

هناك تمييز آخر محتملء غير موجود في الجدولء وهو بين السمات ذات الصلة مقابل 
السمات غير IS‏ الصلة. لأن المدخلات «البنود» التي تعكس نفس السمة egg abl)‏ البنائي) 
ونفس الطريقة ينبغي أن تشترك في كل من تباين الأسلوب «الطريقة» وتباين المفهوم «SLI‏ 
فمن المتوقع أن تكون هذه الارتباطات أعلى. ومن المؤمل أن تكون الارتباطات المقابلة 
لنفس السمة ولكن الأساليب مختلفة هي التالية في العلو. إذا كان الأمر OB VIS‏ هذا 
يشير إلى أن التغاير للمفهوم البنائي أعلى من التغاير للأسلوب أو الطريقة. وبعبارة أخرى. 
إن مقاییسنا كانت أكثر تأثراً ما تم قياسه من LAS‏ أو طريقة قياسه. وعلى النقيض من 
YS‏ يوجد سبب يدعو إلى وجود أي تغاير بين حجم الحذاء وأي من ا مفهومين البنائيّين 
الآخرين عندما يتم قياسهما بإجراءات مختلفة. ومن cad‏ يجب ألا تختلف هذه الارتباطات 
Éu‏ كبيرا عن الصفر. بالنسبة للمفاهيم البنائية غير المتطابقة ولكنها مرتبطة من الناحية 
«dy aul‏ مثل الاكتئاب والقلق» قد يتوقع الشخص وجود بعض التغاير للمفهوم SLI‏ 

ومن ال محتمل أن تكون هذه مجموعة معلومات مفيدة للغاية من الارتباطات Volek)‏ 
لإيجاد وإثبات الصدق Glu!‏ على سبيل JEL‏ إذا كانت مقاييس الاكتئاب لدينا راسخة 
ومستقرة جيداً على حد سواء ولكن يجري حالياً وضع وتطوير مقاييس القلق لديناء يمكننا 
تقييم مقدار التغاير الذي يعزى إلى تشابه المفاهيم في ظل إجراءات قياس مماثلة ومختلفة. 
تؤكد النظرية على أن القلق والاكتئاب ينبغي أن يكونا مرتبطين إلى حد كبير حتى لو تم 
قياسهما بطرق مختلفة. وإذا ثبت أن هذا هو الحالء فإنه سيكون مثابة دليل على الصدق 
Gulab Glu!‏ القلق الجديد لدينا. وبشكل أكثر تحديداً o‏ هذه الارتباطات تشير إلى 
الصدق التقاربي convergent validity‏ أي Sus‏ على التشابه بين مقاييس المفاهيم البنائية 
المرتبطة نظرياً. ومن الناحية المثالية فإن الارتباطات بين القلق والاكتئاب ستكون أقل 
من تلك التي توجد بين اثنين من مقاييس الاكتئاب أو اثنين من مقاييس القلق ولكن 
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أكبر بكثير من بين أي من درجات الاكتئاب وحجم الأحذية. وبنفس القدر من الأهمية 
دليل على أن مقاييس القلق لم ترتبط ارتباطاً ذا دلالة إحصائية مقاييس حجم الحذاء 
بغض النظر عن التشابه أو الاختلاف في تقنية القياس. هذا دليل على الصدق التمايزي 
discriminant validity‏ (ويسمى أحياناً الصدق المتباين (divergent validity‏ وعدم 
وجود ارتباط بين مقاييس المفاهيم البنائية غير ذات الصلة. يشير الارتباط ذي الدلالة 
الإحصائية بين حجم الحذاء والقلق عند قياسها بنفس الطريقة إلى أن الطريقة في حد ذاتها 
تمثل مقداراً كبيراً من التباين (والتغاير) المرتبط بمقاييس مماثلة للمفاهيم البنائية المختلفة. 


جدول )١-6(‏ تفسيرات الارتباطات في مصفوفة الصفات المتعددة - الأساليب المتعددة 











ملاحظات: (TM)‏ تساوي نفس السمة ونفس الطريقة أو الأسلوب (T)9 (SLI)‏ نفس السمة» وطريقة مختلفة؛ (A)9‏ 
و(0) و(5) تشر إلى التكوينات الفرضية «GU!‏ والاكتئاب» وحجم الأحذية على الترتيب. الرموز السفلية (Dg (V)‏ تشير 
إل dy pas & BIS Gull‏ ورف ALLL‏ عن lg)‏ 


ولاحظ ميتشل )1979( Mitchell‏ أن الأساليب والطرق التي تنطوي عليها عملية 
جمع البيانات لمصفوفة الصفات المتعددة - الأساليب المتعددة تشكل دراسة إمكانية 
التعميم ذات وجهين أو جانبين gl) two-facet G-study‏ دراسة قابلية التعميم؛ 
انظر الفصل (CI!‏ مع اعتبار أن السمات والأساليب هي الأوجه أو الجوانب. 
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وتتيح LI‏ مصفوفة الصفات المتعددة - الأساليب المتعددة تقسيم التغاير إلى مصادر 
«الأسلوب» ومصادر «السمة» (أو ا مفهوم البنائي). ويمكننا بعد ذلك تقديم بيانات أكثر دقة 
حول الصدق SLI‏ لأنها تسمح W‏ بالتمييز بين التغاير الذي يعكس بالفعل التشابه بين 
امفهوم البنائي JLo)‏ يرتبط. بالصدق البنائي) عن التغاير الذي هو نتاج تطبيق إجراءات 
قياس متشابهة (وبالتالي لا يرتبط بالصدق البنائي). ولا مكن تحقيق هذا التمييز عندما 
ينظر الشخص ببساطة في ارتباط واحد بين اثنين من المقاييس. 


ماذا عن الصدق الظاهري؟ 


يستخدم العديد من الأشخاص مصطلح «الصدق الظاهري» لوصف مجموعة من البنود 
التي تقيم ما يبدو أنها تقيسه. في رأيي» هذا الاستخدام سين لعدة أسباب: 


Voi‏ الافتراض Gb‏ المقياس يقوم بتقييم ما يبدو أنه يقيسه قد يكون خاطنًا. فعلى سبيل 
eb JEL‏ كل من Jol»‏ وبنياميني» )1997( Idler and Benyamini‏ بفحص YV‏ دراسة 
وبائية كبيرة وأجريت بطريقة جيدة لتحديد ما هو البند المشترك الذي تمت الاستفادة din‏ 
على وجه الدقة. يطلب هذا البند من الناس تقييم صحتهم بشكل عام على أنها إما سيئة 
أو متوسطة أو جيدة أو ممتازة. معظم الناس سيحكمون على هذا المقياس المكون من بند 
واحد لتقييم ما يقولونه بالضبط: صحة المستجيبين. وقد لاحظ ”إدلر وبنياميني“ أن البند 
كان مؤشراً ممتازاً لمجموعة متنوعة من النتائج الصحية. وقد تفوق أداء هذا البند باستمرار 
على المتغيرات الأخرى في حساب التباين عبر الدراسات المختلفة. والأكثر ارتباطاً مناقشتنا 
يبدو أنه لا يتعلق بشكل أساسي بالحالة الصحية. وكثيراً ما تتضمن النماذج بنداً واحد 
وتضع أيضاً مقاييس للحالة الصحية. وعادةً ما تكون مقاييس التقييم GIS SIU)‏ البند 
الواحد للحالة الصحية والمقاييس الأخرى للحالة الصحية giu‏ هامين في نفس النموذج. 
أي إنها لم تشترك في التباين الكافي من أجل المساهمة التنبؤية من جانب واحد gib‏ مساهمة 
تنبؤية مستقلة من الآخر. بل يبدو أن التقييم الذاتي ذا البند الواحد للحالة الصحية يشترك 
في التباين بدرجة أكبر مع المتغيرات النفسية. وتشير هذه النتائج إلى أن هذا البند الواحد 
المستخدم على نطاق واسع ليس مؤشرًا Bolo‏ للحالة الصحيةء كما يظهر. بالنسبة لهذا 
البند فإن النظر إلى ما إذا كان يقيس ما نريد قياسه ليس LIS‏ لدعم ادعاءات الصدق. 


¢ 
Í 
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والمشكلة الثانية في تقييم المقياس استناداً إلى الصدق الظاهري هي أن هناك أوقاتاً 
يكون فيها من امهم ألا يكون المتغير الذي يجري قياسه واضحاً. فعلى سبيل SE!‏ فإن 
أداة ما تهدف إلى تقييم الدرجة التي يجيب بها الأشخاص على نحو غير صحيح (كذباً) As)‏ 
سبيل SLE!‏ لجعل أنفسهم ”يبدون جيدين“) لن يكون من المفيد أن يكون غرضه واضحاً 
للمجيبين. هل نستنتج أنه غير صحيح لأنه لا يبدو كما لو كان يقيس عدم الصدق؟ أتمنى 
ألا يكون كذلك. وهكذاء لدينا هنا حالة لا مكن فيها أن يؤيد عدم النظر إلى ما هو عليه 
في الواقع استنتاج البطلان. 


ومن الشواغل والاعتبارات الأخيرة فيما يتعلق بالصدق الظاهري أنه ليس من الواضح ممن 
ينبغي أن يكون الغرض من الأداة واضحاً في ظاهرها. هل هو المستجيب؟ إذا سأل الطبيب 
المريض عما إذا كان هو أو هي JST‏ عطشاً من المعتاد. فهل يتوقف صدق هذا السؤال على 
معرفة المريض Cub Le‏ منه أو سُثل عنه؟ من الواضح أنه ليس كذلك. هل الشخص الذي 
يصمم ويبني الأداة هو الذي ينبغي أن يدرك ويعرف الغرض من الأداة؟ ومن الصعب أن 
نتصور أن الصلة بين محتوى الأداة وا متغير موضع الاهتمام ليست واضحة بالنسبة لمنشئ 
أداة ما ley)‏ باستثناء الحالات التي تتعلق بالصدق التجريبي البحت» والصدق اللانظري 
atheoretical‏ والصدق hatl‏ بمحك). وإذا تم اعتماد هذا ا معنى Sra‏ الظاهريء 
فسيتم اعتبار جميع المقايبس صادقة أساسا. وأخيراً هل هو مجتمع علمي أكبر أو أوسع 
ينبغي أن يدرك ويعرف غرض أداة ما على أساس مظهرها (ظاهرها)؟ ومن المرجح أن يسفر 
هذا التفسير عن أدلة متضاربة. قد يبدو بند ما إلى بعض الخبراء كما لو كان يقيس متغيراً 
ols‏ وكأنه يقيس متغيراً آخر من وجهة نظر مجموعة خبراء أخرى مؤهلة بنفس الدرجة. 
وغالباً ما يبدو أن الأشخاص الذين يدّعون أن مقياس ما يتمتع بالصدق أو لا يتمتع بالصدق 
لأنه يبدو أنه يتمتع بالصدق الظاهري أو لا يتمتع بالصدق الظاهري تستند ادعاءاتهم 
إلى تصوراتهم الشخصية. أي إنه إذا كان القصد من أداة ما ومظهرها متشابهان لبعضهما 
البعضء فإنهم يلون إلى اعتبار أن الأداة تتمتع بالصدق الظاهري؛ خلاف US‏ فهي ليست 
كذلك. ويبدو أن ذلك يشكل أساساً ضعيفاً لأي ادعاء بالصدق. 
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يتم الخلط أحيانًا بين الصدق الظاهري وصدق المحتوى نظرًا OY‏ كليهما قد يتعلق بمدى 
ما يبدو عليه محتوى البند ذي الصلة بالمفهوم البنائي محل الاهتمام. ومع US‏ هناك 
اختلاف مهم بينهما يتمثل في أن Gro‏ المحتوى يتم تحديده من ناحية إجراءات محددة 
وهذه الإجراءات بشكل عام تكون أكثر تنظيماً ودقة وصرامة مقارنة بالتقييمات غير الرسمية 
للصدق الظاهري. وكما hog)‏ فقد تتضمن هذه الخطوات جمع الأفكار من المجيبين 
المحتملينء كما تشمل bole‏ الحصول على معلومات من الأدبيات النظرية GIS‏ الصلة ومن 
الخبراء في المجال قيد البحث. على سبيل SLL‏ قد يُطلب من خبراء المحتوى تقييم محتوى 
البند في علاقته بتعريف مفهوم بنائي صريح وواضح. ومن المفترض أن يكون لدى هؤلاء 
الخبراء إطار مرجعي نظري يدعم أحكامهم. فمجرد ظهور الصلة أو العلاقة لا يكون هو 
المعيار الوحيد. كما أن الأفراد الذين تستخدم أحكامهم لتقييم الصدق يكونون واضحين. 
علاوة على eS‏ فإن الاستنتاج Gb‏ الأداة تتمتع بصدق المحتوى لا يقتصر على تحديد 
الباحثين أنفسهم. وأخيراء فإن شفافية المجيب ليست Lobe}‏ لتقييم صدق المحتوى BY‏ يتم 
تقييمه Sole‏ (على سبيل المثالء من خلال أحكام الخبراء). وبالتاليء فإن الطريقة الرسمية 
للتحقق من المحتوى يمكن أن تتغلب على قيود ومحددات الاعتماد على الصدق الظاهري. 

وتبعاً للظروف والأحوالء قد تكون هناك مزايا أو عيوب في أن يكون الهدف من الأداة 
واضحاً من مظهره. وكما سنرى في الفصل التاليء le DE‏ تنتج عملية تكوين وتوليد البنود 
عبارات تشير صراحة إلى المتغير محل الاهتمام. Sole liag‏ ليس أمراً سيئًا. أنا لا أقترح أنه 
يجب بناء الأدوات بشكل عام بحيث لا يكون القصد أو الهدف منها واضحًا من مظهرها؛ 
بدلاً من ذلك» فإنني أقترح أنه سواء كان الأمر EUIS‏ أم لاء فليس له علاقة موضوع الصدق. 


تمارين: 

-١‏ اذكر مثالاً على كيف أن نفس الارتباط بين مقياس ما وسلوك ما قد يكون مؤشراً أو دلالة 
على كل من الصدق البنائي أو الصدق المرتبط معيار «محك» واشرح كيف أن (I)‏ 
الدوافع وراء حساب الارتباطء و(ب) تفسير هذا الارتباط يختلف تبعاً لنوع الصدق 
الذي يحاول الباحث تقييمه. 


تطوير المقاييس: النظرية والتطبيق sto‏ 


الفصل الرابع 


-y‏ افترض أن لدى الباحث مقاييس ورقية وقلم رصاص لقياس اثنين من المفاهيم البنائية 
هما: احترام أو تقدير الذات والتوافق الاجتماعي. Goll‏ لديه أيضاً درجات استنادا 
على مقابلات شخصية على نفس المفهومين البنائيّين. كيف هكن استخدام هذه البيانات 
في مصفوفة الصفات المتعددة - الأساليب المتعددة لإظهار أن طريقة جمع البيانات كان 
لها تأثير قوي غير مرغوب فيه على النتائج التي تم الحصول عليها؟ 

-Y‏ كيف هكن أن يؤثر تعريف نطاق أو مجال المحتوى بشكل واسع للغاية لمقياس ما 
تأثيراً سلبياً على صدق ال محتوى الخاص بهذا المقياس عند استخدامه مع مجتمعات 
إحصائية معينة؟ 
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قواعد إرشادية في تطوير المقياس 


حتى OM‏ كانت مناقشتنا مجردة إلى حد ما. ونحن الآن ننظر في كيفية تطبيق هذه 
ا معرفة. paisg‏ هذا الفصل مجموعة من المبادئ التوجيهية أو الإرشادات المحددة التي 
يمكن للباحثين استخدامها في وضع وتطوير القياس واطقياس. 


الخطوة الأولى: حدد بوضوح ما تريد قياسه: 

يعتقد العديد من الباحثين أن لديهم فكرة واضحة عما يريدون قياسه فقط ليجدوا أن 
أفكارهم أكثر غموضاً مما كانوا يعتقدون» وهذا واضح بشكل خادع أو مضلل. وكثيراً ما 
يحدث هذا الإدراك بعد أن تم بذل جهد كبير في إنشاء وتوليد البنود وجمع البيانات - في 
الوقت الذي تكون فيه التغييرات أكثر تكلفة بكثير مما لو تم اكتشافه في بداية العملية. 
هل يجب أن يكون المقياس LEB‏ على نظريةء أم يجب أن تبدأ في اتجاهات فكرية جديدة؟ 
لأي درجة من الدقة ينبغي أن يكون عليها المقياس؟ هل ينبغي التأكيد على بعض جوانب 
الظاهرة أكثر من جوانبها الأخرى؟ 


النظرية كوسيلة مساعدة على تحقيق الوضوح: 

كما هو موضح في الفصل الأول» يتطلب التفكير بوضوح في محتوى مقياس ما التفكير 
جلياً في المفهوم البنائي الذي يتم قياسه. وعلى الرغم من أن هناك العديد من الجوانب 
التقنية التي ينطوي عليها وضع وتطوير مقياس والتحقق من صدقه. فإنه ينبغي ألا نغفل 
أهمية أن يكون له أساس سليم في النظريات الأساسية والموضوعية ذات الصلة بالظاهرة 
ا مراد قياسها. والغرض من أنواع المقاييس التي هي محور التركيز الرئيسي لهذا الكتاب هو 
قياس الظواهر المراوغة التي لا يممكن ملاحظتها مباشرة. ونظرًا لعدم وجود معيار ملموس 
يمكن على أساسه مقارنة slol‏ هذا النوع من المقاييس» فمن المهم أن يكون لديك بعض 
الأفكار الواضحة لتكون مثابة دليل. ويجب إدراك وتحديد حدود الظاهرة حتى لا ينجرف 
محتوى المقياس دون قصد إلى مجالات غير مقصودة. 
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تعد النظرية مساعداً كبيراً على تحقيق الوضوح. وينبغي داماً الأخذ في الاعتبار نظريات 
العلوم الاجتماعية ذات الصلة قبل وضع وتطوير مقياس من النوع الذي تمت مناقشته 
في هذا الكتاب. وإذا تبين أن النظرية الموجودة لا تقدم أي إرشاد أو توجيه لواضعي 
أو مطوري المقاييسء فقد يقررون حينئذ أن الاتجاه الفكري الجديد ضرورياً. ومع EUS‏ 
ينبغي أن يكون هذا القرار Bitwa‏ ومدروساً ولا يتم التوصل إليه إلا بعد مراجعة النظرية 
ا مناسبة المتعلقة بمشكلة القياس قيد النظر. وحتى لو مم تكن هناك نظرية متوفرة لتوجيه 
الباحثين» فيجب عليهم أن يضعوا صيغتهم المفاهيمية الخاصة قبل محاولة قياسها إجرائياً 
وينبغي على الباحثين» في الأساس» أن يحددوا على الأقل نموذجًا نظريًا أولياً أو Be‏ يكون 
بمثابة مرشد أو دليل لوضع وتطوير المقياس. وقد يكون هذا النموذج الأولي بسيطً مثل 
مجرد تحديد الصياغة الجيدة وامموضوعية للظاهرة التي يسعون إلى قياسها. والأفضل من 
ذلك إدراج وصف لكيفية ارتباط البناء المفاهيمي الجديد بالظواهر القائمة وقياسها إجرائياً 


الخصوصية كوسيلة مساعدة على الوضوح: 

وقد يكون مستوى التحديد «الخصوصية» أو العمومية التي يتم بها قياس المفهوم 
البنائي أمراً مهماً أيضاً. وهناك اتفاق عام في العلوم الاجتماعية على أن المتغيرات سوف 
ترتبط بقوة مع بعضها البعض عندما تتطابق في مستوى التحديد أو الخصوصية (انظر أجزن 
وفيشبن -Ajzen& Fishbein,1980‏ للاطلاع على مناقشة (EUS‏ وف بعض الأحيان» يكون 
الهدف من المقياس أن يرتبط أو يتعلق بسلوكيات أو مفاهيم بنائية محددة للغاية» بينما 
في أحيان أخرى, يكون المطلوب مقياس أكثر عمومية وشمولية. 

كمثال توضيحي للمقاييس التي تختلف في درجة التحديد, نأخذ بعين الاعتبار المفهوم 
البنائي الموضع التحكم أو الضبط. موقع التحكم هو مفهوم يستخدم على نطاق واسع 
ويتعلق بتصورات الأفراد حول من أو ما يؤثر على النتائج المهمة في حياتهم. ويمكن تطبيق 
هذا المفهوم البنائي على نطاق guls‏ كوسيلة لشرح أنماط السلوك الشامل أو العالمي 
التي تغطي العديد من الحالات وا مواقف. أو على نطاق ضيقء للتنبؤ بكيفية استجابة 
الفرد في سياق محدد للغاية. ويمكن أيضاً وصف مصادر SWI‏ إما على نطاق واسع أو 
على نطاق ضيق ومحدد للغاية. وعلى سبيل JELI‏ فإن مقياس ”روتر“ )1966( Rotter‏ 
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لموضع التحكم أو الضبط الداخلي - الخارجي» يهتم بالقياس على مستوى عام إلى حد 
مالهذه التصورات. وثمة بُعد واحد يتراوح بين التحكم الشخصي إلى التحكم من خلال 
عوامل خارجية xb‏ هو الأساس الذي يقوم عليه ull‏ والنتائج التي تركز Yule‏ البنود 
تكون dale‏ مثل النجاح الشخصي. كما أن المصادر الخارجية للتحكم أو السيطرة وُصفت 
بعبارات عامة أيضاً. العبارات التالية خاصة بموضع التحكم الخارجي من مقياس ”روتر“ 
موضع التحكم الداخلي - الخارجي: ”إن العام يديره عدد قليل من الأشخاص الموجودين 
في السلطة» وليس هناك الكثير من الشباب الصغير يمكنهم القيام بذلك". 

وقد طورت ليفنسون )1973( Levenson‏ مقياس متعدد الأبعاد مموضع التحكم 
أو الضبط يسمح بوجود ثلاثة مواضع للتحكم هي: الذات» والأشخاص الأقوياء الآخرونء 
والفرصة أو المصير. وهذا يتيح للباحث أن ينظر إلى مصادر التحكم الخارجية بشكل أكثر 
تحديداً من خلال وصفها بأنها Le]‏ الأشخاص الآخرون الأكثر قوة أو المصير. غير أن النتائج 
التي ركزت عليها ظلت عامة. مثال على بند من مقياس «ليفنسون» «للمقياس الفرعي 
الآخرون الأقوياء هو «أشعر أن ما يحدث في Ghe‏ يتم تحديده من قبل الآخرين الأقوياء». 

وقد طور والستونء ووالستونء ودي فيلييس Wallston, Wallston, and‏ 
DeVellis (1978)‏ مقاييس موضع التحكم في الصحة متعددة الأبعاد (MHLC)‏ باستخدام 
المواضع الثلاثة للتحكم التي اقترحتها “Ug uid”‏ مع نتائج خاصة douall‏ مثل تجنب 
المرض أو الإصابة بالمرض. وهذا بند كعينة من بنود مقياس الآخرين الأقوياء من مقياس 
موضع التحكم في الصحة متعددة الأبعاد MFLC‏ هو ”أن يكون لدي اتصال منتظم مع 
طبيبي هو أفضل طريقة لتفادي المرض“. وبعد ذلك طور والستون» وستين» وسميث 
Wallston, Stein, and Smith (1994)‏ مقياساً أكثر تحديداً لنتائج قياس موضع التحكم في 
الصحة سمي ب (MHLC Form C)‏ والذي يتكون من سلسلة من البنود ” نموذج". ويتيح 
هذا الإجراء للباحث تحديد أي مشكلة صحية GIS‏ أهمية عن طريق استبدال اسم المرض 
أو الاضطراب بعبارة ”حالتي“ في كل بند من بنود النموذج. إن أحد البنود كعينة لمقياس 
الآخرين الأقوياء من مقياس Cus (MHLC Form C)‏ بمكن استخدامه في دراسة مرض 
السكريء هو ”إذا رأيت (زرت) طبيبي بانتظام» فأنا أقل عرضة للإصابة مرض السكري“. 
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ومن المحتمل أن يكون كل مقياس من مقاييس موضع التحكم التي تكون أكثر تحديداً 
بصورة تدريجية مفيدة. والأمر الأكثر فائدة يعتمد إلى حد كبير على مستوى النتيجة أو 
عمومية الموضع المتعلق بالسؤال العلمي الذي يتم طرحه. على سبيل JEL‏ إذا كان 
المقصود أو الهدف من مقياس موضع التحكم هو التنبؤ بفئة عامة من السلوك أو ستتم 
مقارنتها مع متغيرات أخرى لتقييم مفاهيم بنائية على المستوى العام فقد يكون مقياس 
”روتر“ Rotter‏ هو الخيار الأفضل لأنه هو مقياس عام Lal‏ من ناحية أخرىء إذا كان 
الباحث مهتماً بالتنبؤ على وجه التحديد بكيفية تأثير ا معتقدات حول تأثير أشخاص آخرين 
على بعض السلوكيات الصحية» فإن مقياس (والستون وآخرونء (VALE‏ قد يكون أكثر ملاءمة 
JY‏ مستوى التحديد يتطابق مع سؤال البحث. وخلال عملية وضع وتطوير كل من هذه 
امقاييسء كان لكل من هذه المقاييس إطار مرجعي واضح يحدد مستوى التحديد اممناسب» 
بالنظر إلى الوظيفة المقصودة للمقياس. والنقطة المهمة هي أن مطوري المقياس يجب أن 
يتخذوا قرار التحديد كقرار نشط وليس مجرد توليد مجموعة من البنود. ومن ثم رؤية 
الشكل الذي تبدو عليه البنود بعد الحقيقة. 


يوضح المثال الخاص بمقياس موضع التحكم الخصوصية أو التحديد فيما يتعلق بالنتائج 
(على سبيل SLL)‏ كيفية إدارة العام مقابل مشاكل مرض السكري) وموضع التحكم 
(أي خارجي بشكل عام مقابل المصير والآخرين الأقوياء بشكل منفصل). ومع ذلك يمكن 
أن تختلف خصوصية وتحديد المقياس على طول عدد من dle!‏ ما في ذلك مجالات 
أو نطاقات المحتوى (على سبيل SEL!‏ القلق مقابل التكيف النفسي على نطاق أوسع). 
أو الإعداد (على سبيل JEBI‏ الاستبيانات المصممة خصيصاً من أجل ملاءمة بيئات عمل 
معينة)» أو ا مجتمع الإحصائي (على سبيل JEL!‏ الأطفال مقابل البالغين أو الأفراد العسكريين 
مقابل طلاب الجامعات). 


توضيح ما يجب تضمينه فى القياس: 


يجب على واضعي ومطوري المقياس أن يسألوا أنفسهم عما إذا كان المفهوم البنائي الذي 
يرغبون في قياسه مختلفاً ومتميزاً عن غيره من المفاهيم البنائية الأخرى. وكما ذكر LIT‏ هكن 
وضع مقايبس بحيث تكون واسعة نسبياً أو ضيقة نسبياً فيما يتعلق بالحالات الذي تنطبق 
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عليها. وهذا هو الحال أيضاً فيما يتعلق بالمفاهيم البنائية التي تغطيها. يُعد قياس القلق 
العام أمراً Leg pire‏ تماماً. وقد يقيس مثل هذا المقياس WS‏ من القلق من الاختبار والقلق 
الاجتماعي على حد سواء. وهذا يُعد أمراً جيداً إذا كان مطابقاً لأهداف واضع (مطور) 
المقياس أو مستخدم المقياس. ومع US‏ إذا كان الشخص مهتماً بنوع واحد فقط محدد من 
القلق» فيجب في هذه الحالة أن يستبعد ا مقياس جميع الأنواع الأخرى للقلق. هكن للبنود 
التي قد «تتقاطع أو تشترك» في مفهوم بنائي gò‏ صلة (على سبيل JELI‏ الاستفادة من القلق 
الاجتماعي عندما يكون موضوع الاهتمام هو قلق الاختبار) أن تكون إشكالية. 


في بعض الأحيانء قد تتم الاستفادة من (تأثير) البنود المتشابهة على ما يبدو في قياس 
مفاهيم بنائية مختلفة تماماً. في مثل هذه الحالات» على الرغم من أن الغرض من اممقياس 
قد يكون قياس ظاهرة واحدة: فإنه قد يكون أيضاً حساساً (مناسباً) لظواهر أخرى. على 
سبيل Gases SLE‏ مقاييس الاكتكاب» مثل مقئاس الاكتقاب الخاص مركز الدراسات الوبائية 
«رادلوف» )1977 (Radloff,‏ تحتوي على بعض البنود التي تستخدم الجوانب الجسدية 
للاكتئاب (على سبيل المثالء فيما يتعلق بقدرة المجيب على ”الانطلاق والتحرك”). وقي 
سياق بعض الظروف الصحية: مثل التهاب امفاصلء قد تؤدي هذه البنود إلى أخطاء 
في جوانب المرض بسبب أعراض الاكتئاب (انظر Jo IS‏ ديفيليسء براونء ووالستون 
Blalock, DeVellis, Brown, &Wallston, 1989‏ لمناقشة هذه النقطة تحديداً). قد 
يختار الباحث الذي يطور Lilie‏ جديدًا للاكتئاب تجنب الجوانب الجسدية إذا كان من المقرر 
استخدام المقياس مع مجتمعات إحصائية معينة (مثل ا مرضى بمرض مزمن) أو مع مقاييس 
أخرى للمفاهيم البنائية الجسدية (مثل قصور الغضروف الدرقي ”الوسواس القهري“). وقد 
يكون من ال مهم dae‏ بطبيعة led!‏ أن يُستخدم لأغراض أخرى ghol‏ وتضمين بنود جسدية 
كما هو الحال عندما يتعلق البحث على وجه التحديد بالجوانب الجسدية SW‏ السلبي. 


الخطوة الثانية: توليد مجموعة من البنود: 
بمجرد أن يتم توضيح الغرض من المقياس بصورة محددةء يكون واضع أو مطور lk!‏ 
Bale‏ للبدء في بناء وإنشاء Sol‏ القياس بشكل جدي. وتتمثل الخطوة الأولى في إنشاء 
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اختر البنود التي تعكس الغرض من المقياس: 

من الواضح أنه ينبغي اختيار هذه البنود أو إنشاؤها مع مراعاة هدف القياس المحدد. 
وينبغي أن يوجه هذه العملية الوصف الدقيق لما يهدف المقياس عمله بالضبط. تذكر 
أن جميع البنود التي تشكل مقياساً متجانساً ينبغي أن تعكس المتغير الكامن الذي تقوم 
عليه. ويمكن اعتبار كل ay‏ بمثابة اختبارء في حد ذاته» لقوة المتغير الكامن. ML‏ ينبخغي 
أن يعكس محتوى كل بند في المقام الأول المفهوم البنائي محل الاهتمام. وستشكل البنود 
المتعددة اختباراً أكثر ثباتاً من كل بند من البنود على Bae‏ ولكن يجب أن يظل كل منها 
حساساً للدرجة الحقيقية للمتغير الكامن. 

من الناحية dy aul‏ يتم اختيار مجموعة جيدة من البنود بطريقة عشوائية من 
مجموعة كلية أو شاملة universe of items‏ من البنود المتعلقة بالمفهوم GLI!‏ محل 
الاهتمام. ويفترض أن تكون المجموعة الشاملة من البنود كبيرة بشكل لا نهائي» وهو ما 
يحول إلى حد كبير دون أي أمل في التعرف عليه في الواقع واستخراج البنود منها بشكل 
عشوائي. ومع ذلك» ينبغي أن يوضع هذا الوضع JUL‏ في الاعتبار. إذا كنت تكتب بنوداً 
جديدة» كما هو الحال في كثير من GLE!‏ يجب أن تفكر بشكل إبداعي في المفهوم SUI‏ 
الذي تسعى إلى قياسه. ما هي الطرق الأخرى التي يمكن بها صياغة بند ما للوصول إلى 
المفهوم البنائي؟ وعلى الرغم من أنه لا ينبغي ألا تتجاوز هذه البنود حدود تعريف المفهوم 
البنائي المحدد. فإنه ينبغي أن تستنفد هذه الإمكانيات أنواع البنود الواقعة داخل تلك 
الحدود. ويتم تحديد خصائص امقياس بواسطة البنود التي يتكون منها. وإذا كانت البنود 
تعكس أو تجسد بشكل ضعيف المفهوم الذي عملت على توضيحه فترة طويلة Alig‏ فإن 
المقياس لن يعكس بدقة جوهر المفهوم GUI‏ 

ومن امهم LAT‏ أن يكون «الشيء» الذي تشترك فيه البنود مفهوماً بنائياً حقيقياً وليس 
مجرد فئة. وتذكر مرة أخرى أن نماذجنا لوضع وتطوير المقياس تعتبر agil‏ مظاهر علنية 
لتغير كامن مشترك هو سببها. يتم تحديد الدرجات على البنود المتعلقة بمفهوم Gls‏ مشترك 
بالدرجة الحقيقية لهذا المفهوم البنائي. ومع EUS‏ كما هو مذكور في الفصل الأولء ayab‏ أن 
البنود تتعلق بفئة category‏ مشتركة, فإن ذلك لا يضمن أن لها نفس المتغير الكامن الأساسي. 
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وغالبًا ما تحدد مصطلحات مثل الاتجاهات أو العوائق التي تحول دون الامتثال أو أحداث 
الحياة فئات المفاهيم البنائية بدلاً من المفاهيم البنائية نفسها. مجموعة من البنود التي 
ستكون في نهاية المطاف أساس المقياس الأحادي البعد ينبغي ألا تتقاسم فقط التركيز على 
الاتجاهات» على سبيل JEL!‏ بل على اتجاهات محددةء مثل الاتجاهات نحو معاقبة متعاطي 
ا مخدرات. هكن للشخص افتراض تصور حول dow‏ من سمات شخص ما - متغير كامنء إذا 
صح التعبير - من شأنه أن ”يسبب“ ردود على البنود التي تتناول معاقبة متعاطي المخدرات. 
ومن التحديات الكبيرة أن نتصور أن إحدى السمات أو الخصائص تفسر الاتجاه بشكل عام. 
وينطبق الشيء نفسه على الأمثلة الأخرى المذكورة. Bole‏ ما تكون Bilge‏ الامتثال من أنواع 
عديدة. قد Jig‏ كل نوع Ue)‏ سبيل JELI‏ الخوف من BLES!‏ الأعراض» والقلق بشأن 
تكاليف العلاج» وتوقع AII‏ والمسافة إلى مرافق (مؤسسات) العلاج» وتصورات المناعة) متغير 
كامن. قد يكون هناك حتى علاقات متبادلة بين بعض المتغيرات الكامنة. ومع OB US‏ 
US‏ من هذه العوائق هي مفهوم Gly‏ منفصل. ومن ثم» OL‏ مصطلح العوائق يصف فئة 
من المفاهيم البنائية بدلاً من مفهوم بنائي على حدة يرتبط بمتغير كامن واحد. ولا ينبغي أن 
يُتوقع من البنود التي تقيس مختلف المفاهيم البنائية التي تندرج ضمن نفس الفئة (مثل 
التصورات حول المناعة وا مخاوف بشأن تكاليف العلاج) أن تختلف في طريقة عمل البنود 
عندما تكون مظهراً لمتخير كامن مشترك. 


التكرار: 
من المفارقات أو التناقضات أن التكرار Redundancy‏ بعد dow‏ أو خاصية جيدة وسيئة 
للبنود الموجودة في المقياس. ويستلزم حل هذه المفارقة التمييز بين سمات أو خصائص 
البنود التي تعزز وتدعم المقياس من خلال التكرار وتلك التي لا تفعل ذلك. لأن هذا 
الموضوع le WE‏ يكون مصدرًا للالتباس» فسوف أناقش ذلك بشيء من التفصيل» وسأقوم 
بادئ ذي بدء بالقضية التي تؤيد التكرار. 
في هذه المرحلة من عملية وضع وتطوير االمقياسء من الأفضل أن يكون أكثر شمولاً 
وأن تكون كل الأمور الأخرى متساوية. التكرار ليس بالأمر السيء عند وضع المقياس. 
في الواقح» فإن النماذج النظرية التي توجه جهودنا لوضع وتطوير المقاييس تعتمد على التكرار. 
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في مناقشة معادلة تنبؤ “سبيرمان براون “Spearman-Brown‏ في الفصل UW‏ أشرت إلى 
أن SLI‏ يختلف كدالة في عدد البنود. وكل الأمور الأخرى تكون متساوية. ونحن نحاول 
تجسيد الظاهرة محل الاهتمام من خلال وضع وتطوير مجموعة من البنود التي تكشف عن 
هذه الظاهرة بطرق مختلفة. وباستخدام بنود متعددة تبدو By Ste‏ فإن المحتوى Sj GL!‏ 
بين البنود سيتم جمعه عبر البنود بينما سيتم إلغاء الخواص غير ذات الصلة. وبدون التكرارء 
سيكون ذلك مستحيلاً. 


ومع ذلك» فإن كل أشكال التكرار أمراً ليس مرغوباً فيه. ويتعلق التكرار المفيد بالمفهوم 
البنائي» وليس بالجوانب العرضية أو الثانوية للبنود. تأمل في البندين التاليين: النسخة 
الأصلية هي «شيء مهم ú>‏ نجاح «Lab‏ والنسخة المعدلة. «الشيء المهم ú>‏ هو نجاح 
طفاي». م يتم تغيير شيء أكثر من أداة النكرة «a»‏ إلى أداة التعريف”ال “the‏ في بند ما 
بالتأكيد سيعطيك تكرارًا فيما يتعلق بالمحتوى الهام A iW‏ ولكن البنود الأصلية واب معدلة 
ستكون أيضًا تكراراً فيما يتعلق بالعديد من الأشياء التي تريد تغييرهاء مثل بنيتها النحوية 
الأماسية واختيار الكلمات. ومن ناحية أخرىء OB‏ بندين مثل ”سأفعل أي شيء تقريبًا 
لضمان نجاح طفلي“ و”لا توجد تضحية أكبر إذا كان ذلك يساعد طفلي على النجاح“ قد 
تكون تكراراً بشكل مفيد لأنها تعبر عن فكرة مماثلة بطرق مختلفة إلى حد ما. فهي 
تكرار فيما يتعلق بالمتغير محل الاهتمام ولكنها ليست Loud DIS‏ يتعلق ببنيتها النحوية 
ومفرداتها العرضية (الثانوية). وعندما يتم تجنب التكرارات التي ليست ilo SIS‏ فإن 
التكرارات ذات الصلة سوف تسفر عن مجموعات بنود أكثر BG‏ 

علاوة على ذلك» وعلى الرغم من أن التكرار في الأداة النهائية قد يكون غير مرغوب 
ad‏ فإن المسألة تكون أقل أهمية خلال المراحل المبكرة من وضع البنود. وبناءً على US‏ 
قد تكون هناك قيمة وفائدة لصيغتي أو نسختي البند المختلفتين في كلمة واحدة فقط 
لإدراجهما وتضمينهما في اختبار البند USVI‏ من خلال عمل US‏ يمكن التحقق مما إذا 
كانت إحدى النسختين للبند متفوقة (أي أكثر جودة) على الأخرىء ومن ثم يمكن إدراج 
وتضمين البند المتفوق في النسخة النهائية للمقياس. وقد تم تقديم حجة ضد التكرار Gjo‏ 
وهي: أن سمات البنود السطحية المكررة مثل المفردات العرضية أو الثانوية (أي غير ذات 
الصلة با مفهوم (GLI‏ أو البنية النحوية لا تعد ميزة. قد تؤدي أوجه التشابه في الصياغة 
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التي لا صلة لها بالمفهوم GLI‏ إلى تفاعل المجيبين بشكل مماثل مع البنود بطريقة تسفر 
عن تقدير مبالغ فيه للثبات. على سبيل JEL‏ إذا كانت هناك عدة بنود تبدأ بعبارة مشتركة 
(على سبيل JEBI‏ «عندما أفكر في الأمرء (a...‏ قد يؤدي مجرد التشارك في تلك العبارة إلى 
ارتباط تلك البنود ببعضها البعض بشكل أقوى. ولا يميز مؤشر الثبات مثل «ألفاكرونباخ» 
بين التغاير للبنود الناشئ عن تلك الصياغة المشتركة والتغاير الذي يعزى إلى التأثير ا مشترك 
للمتغير محل الاهتمام. ومن ثم سيكون تقدير الثبات مبالغاً فيه أو متضخماً. 

وفي حين أن السمات النحوية المماثلة أو غيرها من السمات السطحية الأخرى يمكن 
أن تشكل تشابهاً غير مرغوب فيه في المحتوى» قد يؤدي التكرار غير المرتبط بشكل كامل 
بالمفهوم البنائي موضع الاهتمام إلى حدوث مشكلة في بعض الظروف. ويمكن أن يحدث هذا 
عندما تختلف بعض البنود عن معظم البنود الأخرى في مجموعة فيما يتعلق بالخصوصية 
أو التحديد. على سبيل المثالء لنفكر ملياً في مقياس افتراضي يهدف إلى قياس الاتجاهات 
نحو محبي الحيوانات الأليفة. قد يكون من المناسب ghol‏ مجموعة متنوعة من البنود 
في المقياس. وقد تكون هناك sgu‏ أخرى al‏ وإن كانت ذات dbo‏ بالمفهوم البناي موضع 
الاهتمام. محددة أكثر من اللازم - وبالتالي مكررة إلى حد كبير - للعمل بشكل جيد. قد 
تكون البنود التالية «عشاق الببغاء الرمادي الأفريقي هم أشخاص لطاف» و«أعتقد أن 
الناس الذين يحبون الببغاوات الرمادية الأفريقية هم أشخاص طيبون» متشابهة إلى حد 
كبير ليس فقط بسبب تشابه البنية النحوية ولكن بسبب احتمال أن يكون المحتوى الذي 
يتقاسمه البندين ملائماً ولكنه محدد بشكل مبالغ فيه. قد يقومون بسحب البند الذي 
تم تحديده ككل بعيداً عن المتغير الكامن المستهدف أو المقصود (الاتجاهات نحو محبي 
الحيوانات الأليفة) إلى بديل أكثر تحديداً للمتغير الكامن (الاتجاهات نحو عشاق الببغاء 
الرمادي الأفريقي). ومع الأخذ في الاعتبار وجود مجموعة كبيرة من الحيوانات الأليفة, 
هناك بندان حول نوع معين وغير مألوف من الحيوانات الأليفة متشابهان بشكل كبيرء 
ومن المحتمل أن يقوضا الغرض من الأداة. 

وبصورة OL «eel‏ مدى عمومية أو تحديد المفهوم GLI‏ موضع الاهتمام يمكن أن 
يغير من تأثير التكرار. وعلى الرغم من أن مثال الببغاء الرمادي الأفريقي قد يبدو متطرفاً 
بعض الشيء. فإن إدراج بنود لا تتطابق مع خصوصية أو تحديد ا لمفهوم Sill‏ موضع 
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الاهتمام يمكن أن يحدث في سياق أقل غرابة. على سبيل المثالء في أداة تم تصميمها 
لتعكس أو تجسد جميع جوانب العاطفةء فإن العديد من البنود المتعلقة بالقلق قد تمثل 
مشكلة. ومن ال محتمل أن تكون الارتباطات بين هذه البنود أكبر من الارتباطات بين تلك 
البنود Lents‏ من البنود التي لا تتعلق بالقلق. وكنتيجة UY‏ قد تشكل هذه البنود 
مجموعة فرعية من بنود القلق داخل المجموعة الأوسع من بنود العاطفة. وهذا يمكن 
أن يسبب عدداً من المشكلات. Yoh‏ قد يؤدي ذلك إلى تقويض أو الإضرار بأحادية البعد 
لمجموعة البنود (التي ستكون مشكلة إذا كانت نية أو هدف الباحث هو وضع مقياس 
واحد perk‏ أحادي البعد). dad‏ قد يؤدي ذلك إلى إنشاء نقطة اتصال غير مقصودة ينتج 
عنها بنود أكثر تشابهاً لتلك الموجودة في عنقود (مجموعة) القلق التي يبدو أنها أفضل أداءً 
من تلك البنود التي تكون أقل تشابهاً. فعلى سبيل اممثال» على الرغم من أن بنداً متعلقاً 
بالقلق وآخر متعلق بالخوف قد يكونان على نفس القدر من الأهمية بالنسبة لوجهة النظر 
الواسعة للعواطفء فإن البند الأول قد يسهم بقوة أكبر في الثبات من البند الأخير إذا كانت 
هناك أغلبية عددية لبنود القلق في الأداة. ونتيجة UU‏ قد يتجاوز متوسط ارتباط بند 
القلق متوسط ارتباط بند الخوفء مما يؤدي إلى زيادة مساهمته في تقدير الثبات. والواقع 
أن الأداة التي تتضمن تمثيلاً مبالغاً فيه لبنود القلق على النحو الموصوف لن تعبر عن جميع 
العواطف بالتساوي ولكن ستكون منحازة نحو القلق. 

وعلى النقيض من US‏ فإن نفس النوع من بنود القلق التي توصف بأنها تمثل إشكالية 
في الفقرة السابقة قد لا تكون تكراراً بشكل مفرط أو مبالغ فيه في أداة GIS‏ تركيز أضيق. 
ومن الواضح أنه إذا كانت الأداة مصممة لتقييم القلق» فينبغي أن تكون جميع البنود ذات 
صلة بذلك المتغير وأن التشابه لن يكون حالة من حالات التكرار غير المرغوب فيه. وعلى 
النقيض من ذلك فإن البنود التي تتضمن عبارة أكثر عموميةء مثل «مشاعري العامة» قد 
تشكل مجموعة فرعية إذا تم تضمينها في حالة مقياس القلق بسبب تركيزها العاطفي غير 
المحدد. غير أن ما يبدو على أنه مشكلة تكرار قد يكون في الواقع مسألة مدى تطابق البنود 
مع خصوصية وتحديد المفهوم البنائي الذي يعتزم الباحث تقييمه. 


في أداة تهدف إلى تجسيد متغير أكثر تحديدًاء فمن ال مرجح أن البنود سوف تظهر أو تبدو 
أكثر تشابهًا مع yas‏ البعض. dole‏ على سبيل JELI‏ ستبدو البنود الموجودة في مقياس 
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يقيس القلق في مجال الخطابة العامة أكثر تشابهاً مع بعضها البعض (نظرًا لخصوصية 
المتغير موضع الاهتمام) من البنود الموجودة في مقياس يقيس الحالات العاطفية على نطاق 
أوسع. وقد لا تكون هذه مشكلة طاما كانت dog]‏ التشابه مرتبطة بالمفهوم البنافي موضع 
الاهتمام. وكما ذكرنا من قبلء فإن البنود المتشابهة بقدر ارتباطها بمتغيرها المقصود وليس 
في أي مجال آخر يمكن أن تكون بنوداً جيدة. 


ous‏ البنود: 
من المستحيل تحديد عدد البنود التي ينبغي إدراجها أو تضمينها في تجمع JS]‏ ويكفي 
القول إنك تريد أكثر بكثير مما تخطط لإدراجه في المقياس Gl!‏ تذكر أن ثبات الاتساق 
الداخلي هو دالة Gab‏ قوة ارتباط البنود مع بعضها البعض (وبالتالي مع المتغير الكامن) 
وعدد البنود الموجودة لديك في المقياس. وها أن طبيعة الارتباطات المتبادلة بين البنود 
تكون غير معروفة bole‏ في هذه المرحلة من وضع وتطوير المقياسء فإن وجود الكثير من 
البنود يُعد شكلاً من أشكال التأمين ضد ضعف الاتساق الداخلي. كلما زاد عدد البنود 
التي لديك في المجموعة المتوفرة لديك في تجمع البنود. كان الأمر أكثر صعوبة بشأن اختيار 
البنود التي ستؤدي المهمة التي تنوي القيام بها. وليس من غر المعتاد البدء ds gang‏ 
من البنود التي يبلغ حجمها ثلاثة أو أربعة أضعاف الحجم النهائي للمقياس. وهكذاء قد 
يتطور مقياس مكون من عشرة بنود من مجموعة تضم ٤٠‏ بنداً. وإذا كان من الصعب 
بشكل خاص توليد وإنشاء بنود في مجال معين من مجالات المحتوى أو إذا كانت البيانات 
التجريبية تشير إلى أنه لا توجد حاجة إلى بنود عديدة لتحقيق اتساق داخلي ee‏ فقد 

يكون التجمع الأول للبنود أصغر بنسبة +10 من حجم المقياس النهائي. 

بشكل عام» كلما كان تجمع البنود ST‏ كان ذلك أفضا. ومع US‏ فمن المؤكد أنه 
من ا ممكن تطوير تجمع كبير جداً من البنود بحيث لا يمكن إدارته في مناسبة واحدة لأي 
مجموعة واحدة من الأشخاص. إذا كان تجمع البنود كبيراً بشكل استثنايء يمكن للباحث 
أن يلغي ويحذف بعض البنود وفقاً لمعايير مسبقةء مثل عدم الوضوح» والأهمية أو الصلة 
المشكوك فيهاء أو التشابه غير المرغوب فيه مع بنود أخرى. 
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LIE‏ ما يكون البدء في كتابة البنود هو أصعب جزء في عملية توليد وتكوين البنود. 
واسمحوا لي أن أصف كيف أبدأ هذه العملية. في هذه dle jbl‏ أكون أقل اهتماماً بجودة 
البنود ونوعيتها من مجرد التعبير عن الأفكار ذات الصلة. وأبدأ في كثير من الأحيان بعبارة أو 
فقرة تمثل إعادة صياغة للمفهوم البنائي الذي أريد قياسه. على سبيل JELI‏ إذا كنت age‏ 
بوضع وتطوير مقياس للإدراك الذاتي SW‏ الإعلانات التجاريةء فيمكن أن أبدأ بالعبارة أو 
الفقرة التالية «أنا سريع التأثر بالإعلانات التجارية». بعد ذلك سأحاول توليد وإنشاء فقرات 
وعبارات إضافية تدور حول نفس الفكرة بشكل مختلف إلى حد ما. قد تكون العبارة التالية 
«الإعلانات التجارية تؤثر AS Ye‏ وسأستمر بهذه الطريقة أو الأسلوب» مع عدم الاهتمام 
بوجود أي معايير للجودة تقريباً في العبارات. وهدفي في هذه المرحلة المبكرة هو مجرد 
تحديد مجموعة كبيرة من الطرق التي يمكن من خلالها توضيح وتحديد المفهوم الأساسي 
الذي تستهدفه الأداة. وأثناء الكتابةء فإنني قد أبحث عن طرق بديلة للتعبير عن الأفكار 
النقدية. على سبيل ال مثال» قد أستبدل عبارة «الإعلانات التجارية» بعبارة هي «الأشياء التي 
أراها في إعلانات التلفزيون أو المجلات» في المجموعة التالية من الجمل. وأنا أجد أن الكتابة 
بسرعة ودون نقد يُعد أمراً مفيداً. بعد توليد وإنشاء رها ثلاثة أو أربعة أضعاف عدد البنود 
التي أتوقع bolo!‏ وتضمينها في الأداة النهائيةء سوف ألقى نظرة على ما قمت بكتابته. 
والآن قد حان الوقت الحاسم أو المهم. Cue‏ هكن فحص البنود للوقوف على مدى جودة 
تجسيدها للأفكار الأساسية ومدى وضوح الصياغة. وتحدد الأقسام التالية بعض خصائص 
البنود المحددة لتجنبها أو إدراجها في عملية الاختيار من قائمة العبارات الأصلية وتنقيحها. 


خصاتص البنود الجيدة والبنود did!‏ 


إن سرد جميع الأشياء والأمور التي تجعل بنداً ما جيداً أو سيئاً تعد مهمة مستحيلة. ومن 
الواضح أن مجال أو نطاق المحتوى له تأثير كبير محتمل على جودة البند. ومع US‏ هناك 
بعض الخصائص التي تفرق وتميز على نحو موثوق أفضل البنود عن أسوأ البنود. وتتعلق 
معظم هذه الخصائص بالوضوح. وكما هو Que‏ في الفصل الأول ينبغي أن يكون البند الجيد 
واضحاً لا لبس فيه. وينبغي التخلي عن الأسئلة التي تضع المجيب في مأزق وارتباك. 
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يجب على واضعي أو مطوري المقياس تجنب agil‏ الطويلة بشكل استثنائيء حيث إن 
طول البند dole‏ ما يزيد من التعقيد ويقلل من الوضوح. غير أنه ليس من المرغوب فيه أو 
امستصوب التضحية بمعنى أو بمدلول بند ما لصالح الإيجاز. إذا كان تعديل البند Grane‏ 
لإيصال ونقل الغرض من أحد ogil‏ فقم بإدراجه. ومع US‏ تجنب الإسهاب والإطناب غير 
الضروري. وبوجه ple‏ سيكون بند ما مثل «كثيراً ما أجد صعوبة في التعبير عن وجهة نظري» 
أفضل من عبارة أطول دون داع مثل «من الإنصاف القول إن أحد الأشياء التي يبدو لي أنني 
أواجه فيها مشكلة في كثير من الوقت هو إيصال ونقل وجهة نظري إلى أشخاص آخرين». 

ونمة اعتبار آخر gd‏ صلة باختيار أو تطوير البنود هو مستوى صعوبة القراءة الذي 
تتم به كتابة البنود. هناك مجموعة متنوعة من الأساليب de)‏ سبيل JEL)‏ دايل وشلء 
Dale & Chall, 8‏ فري» 1977 (Fry,‏ لتعيين مستويات الصف بالنسبة للكلام النثري ها 
في ذلك بنود المقياس. dole‏ ما تساوي هذه الكلمات والجمل الأطول مع مستويات القراءة 
الأعلى. ويفترض أن قراءة معظم الصحف ال محلية تتطلب مستوى قراءة للصف السادس. 

يحدد ”فري“ )1977( Fry‏ عدة خطوات لتحديد مستوى القراءة LoS‏ الخطوة الأولى 
هي تحديد عينة من النص الذي يبدأ بالكلمة الأولى من الجملة ويحتوي على ٠٠١‏ كلمة 
بالضبط. (بالنسبة للمقاييس التي تحتوي على عدد قليل من البنود فقطء قد تضطر إلى 
تحديد جزء مناسب من ٠٠١‏ وتأسيس الخطوات اللاحقة على هذه النسبة.) بعد US‏ 
احسب sus‏ الجمل الكاملة واممقاطع اللفظية الفردية في dus‏ النص. ويتم استخدام 
هذه القيم كنقاط إدخال لمخطط أو رسم بياني يوضح مستوى الصف المكافئ أو المعادل 
لتوليفات وتركيبات مختلفة من الجملة وتعداد ال مقاطع اللفظية من العينة المكونة من 
٠‏ كلمة. يشير الرسم البياني إلى أن متوسط sus‏ الكلمات والمقاطع لكل جملة لمستوى 
القراءة في الصف الخامس هو VE‏ و18 على التوالي. وتبلغ الجملة المتوسطة في الصف 
السادس ٠١‏ أو ١1‏ كلمة وما مجموعه ٠١‏ مقطعاً لفظياً؛ أما جملة مستوى الصف السابع 
فتتكون من حوالي VA‏ كلمة و6 Lad Lebel‏ ويمكن أن تسفر الجمل الأقصر التي تحتوي 
على نسبة أعلى من الكلمات الأطول أو الجمل الأطول مع عدد أقل من الكلمات الطويلة 
عن مستوى Joles‏ الصف. على سبيل SUL)‏ يتم تصنيف جملة مكونة من CLS ٩‏ و١٠‏ 
مقطعاً لفظياً i)‏ ما يصل إلى ٤٤‏ كلمات متعددة المقاطع او متشابكة) أو جملة مكونة 
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من ۱۹ كلمة و۲۲ مقطعاً لفظياً gi)‏ ما لا يزيد عن “١6‏ من الكلمات متعددة المقاطع أو 
متشابكة) على حد سواء على أنها تعادل مستوى القراءة للصف السادس. ومن ال محتمل أن 
يكون الهدف من تحقيق مستوى للقراءة بين الصفين الخامس والسابع Bus‏ مناسباً لعظم 
الأدوات التي سيتم استخدامها مع المجتمع الإحصائي العام. فعلى سبيل ا SEL‏ كُتبت بنود 
مقاييس موضع الضبط أو السيطرة الصحية المتعدد الأبعاد على مستوى القراءة من الصف 
الخامس إلى الصف السابع. وهناك بند نموذجي في هذا المستوى من القراءة هو «معظم 
الأشياء التي تؤثر على صحتي تحدث لي عن طريق الصدفة» )1978 (Wallston et al.,‏ 
هذ البند يتكون من ١١‏ كلمة و0١مقطعاً‏ لفظياً مما يضع هذا البند في مستوى القراءة 
للصف السادس. 


ويشير فري )1977( Fry‏ إلى أنه ينبغي النظر في العوامل الدلالية والنحوية وأخذها 
في الاعتبار عند تقييم صعوبة القراءة. ونظرًا لأن الكلمات القصيرة تميل إلى أن تكون أكثر 
شيوعًاء وتميل الجمل القصيرة إلى أن تكون أبسط من الناحية النحوية» فإن الإجراء الخاص 
ب ”فري“ يعد بديلاً Vode‏ لطرق تقييم الصعوبة الأكثر تعقيداً. ومع US‏ وكما هو الحال 
مع المعايير الأخرى للكتابة أو اختيار البنود الجيدة» يجب على الشخص استخدام المنطق 
السليم في تطبيق أساليب مستوى القراءة. بعض العبارات المختصرة التي تحتوي فقط على 
كلمات قصيرة ليست Agi‏ أو بسيطة. على سبيل JELI‏ عبارة مثل «تجنب الازدراء في 
الكاسك» Eschew casque scorn‏ من المرجح أن تربك Lass‏ ما مستوی تعليم ابتدائي 
أكثر من عبارة ”ارتد خوذتك“ Wear your helmet‏ على الرغم من أن كل جملة يوجد بها 
ثلاث كلمات وأربعة مقاطع لفظية. وهناك مصدر آخر للارتباك والالتباس المحتمل يجب 
تجنبه وهو كلمات النفي «السلبيات» المتعددة. العبارة التالية «أنا لا أؤيد قيام الشركات 
بوقف تمويل الجماعات ال مناهضة للأسلحة النووية» تعد أمراً مربكاً ATT‏ بكثير من العبارة 
التالية «أنا أؤيد الدعم الخاص المستمر للمجموعات التي تدعو إلى حظر الأسلحة النووية». 
(من اطفيد LAs)‏ ملاحظة أن هاتين العبارتين قد تعبران عن مواقف مختلفة بشأن هذه 
القضية. فعلى سبيل JULI‏ قد تنطوي هذه العبارة الأخيرة على تفضيل دعم القطاع الخاص 
عن دعم القطاع العام للجماعات امعنية). 
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وينبغي أيضاً تجنب ما يسمى بالبنود المزدوجة .double-barreled items‏ وهي البنود 
التي تنقل فكرتين أو أكثر بحيث أن الإجابة على البند با موافقة قد يشير إلى أي من الأفكار 
أو كليهما. العبارة التالية «أنا أؤيد الحقوق المدنية GY‏ التمييز وعدم المساواة جريمة ضد 
الله» هي مثال على البند المزدوج. إذا كان الشخص يدعم الحقوق المدنية لأسباب أخرى 
غير الإإساءة إلى الذات الإلهية Ae)‏ سبيل JE‏ لأنها جريمة ضد الإنسانية)» ASS‏ ينبغي 
أن يجيب/ تجيب على البند؟ فقد تعبر الإجابة السلبية بشكل غير صحيح عن عدم تأييد 
الحقوق المدنية» والإجابة الإيجابية قد تنسب بشكل غير صحيح دافع إلى دعم ا مجيب. 

وثمة مشكلة أخرى يجب على واضعي ومطوري المقياس تجنبها هي إشارات الضمير 
الشخصي pronoun‏ الغامضة. البند JW)‏ ”يجب على القتلة ومرتكبي جرائم الاغتصاب 
ألا يلتمسوا العفو من السياسيين لأنهم حثالة الأرض“ قد يعبر عن مشاعر بعض الناس بغض 
النظر عن إشارة الضمير. gag)‏ ذلك dole‏ ما ينوي مطور مقياس أن يكون أكثر وضوحاً 
حول ما يعنيه البند). هذه الجملة يجب أن تكون سيئة أو غير مرغوبة مرتين. فبالإضافة 
إلى إشارة الضمير الغامضة؛ فهي بند مزدوج. وتؤدي المعدّلات modifiers‏ التي تكون في غير 
محلها إلى حالات غموض والتباس مماثلة لإشارات الضمير الغامضة: الجملة التالية: ”ينبغي 
لأعضائنا في الكونغرس أن يعملوا بجد لإضفاء الشرعية (لتقنين البغاء) على البغاء في مجلس 
النواب“ هي مثال على هذه المُعدّلات. استخدام أشكال أو نماذج الصفات بدلاً من أشكال 
الأسماء يمكن أيضاً أن يحدث ارتباكاً وتشويشاً غير مقصود. النظر في الاختلافات في المعنى 
بين All vagrants should be given a schizophrenic assessment‏ ”.2 إعطاء 
جميع المتشردين تقييم المصاب بانفصام الشخصية" All vagrants should be given ag‏ 
schizophrenia assessment‏ ”ينبغي elas!‏ جميع المتشردين تقييم انفصام الشخصية". 

إن الكلمات الفردية ليست هي المصادر الوحيدة لغموض البند. فالجملة بأكملها 
يمكن أن يكون لها أكثر من معنى واحد. وم Í‏ في الواقع سوى دراسة استقصائية واحدة 
للسلوك الجنسي للمراهقين تضمنت بنداً لتقييم تعليم الوالدين. وبالنظر إلى سياق الدراسة 
الامتقصائية SSS‏ فإن الصياغة كانت مؤسفة: «إلى أي مدى Cums‏ أمك إلى المدرسة؟» 
(How far did your mother go in school?)‏ وقد فشل الباحثون تماماً في التعرف على 
ا معنى غير المقصود لهذه الجملة إلى الحد الذي أثار سخط مجموعة من امهنيين أثناء عرض 
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حلقة النقاش. وأظن أن عدداً لا بأس به من المجيبين المراهقين قد ضحكوا أيضاً من هذا 
البند. ولا بُعرف كيف أثر ذلك على ردودهم على ما تبقى من الاستبانة. 


البنود ذات الصياغة الإيجابية والبنود ذات الصياغة السلبية: 


يختار العديد من مطوري المقاييس كتابة البنود ذات الصياغة السلبية التي تمثل 
مستويات منخفضة أو حتى غياب المفهوم البنائي موضع الاهتمام وكذلك البنود ذات 
الصياغة الإيجابية الأكثر LE Gilly Egi‏ وجود المفهوم البنائي موضع الاهتمام. والهدف 
من ذلك هو الوصول إلى مجموعة من البنود. يشير بعضها إلى مستوى Jle‏ من المتغير 
الكامن عند الموافقة عليه وإقراره» وأخرى تشير إلى مستوى عالٍ عند عدم TARI‏ على 
امتغير الكامن. على سبيل JELI‏ يتضمن مقياس «روزنبرغ» )1965( Rosenberg‏ لتقدير 
الذات» على سبيل JEB‏ بنوداً تشير إلى التقدير العالي للذات (على سبيل SEL!‏ ”أشعر 
GW ob‏ عددًا من الصفات الجيدة“) وأخرى تشير الى تقدير للذات منخفض (على سبيل 
ا مثال» ”أشعر بالتأكيد أنني عديم الفائدة في بعض الاحيان“). والغرض من صياغة البنود 
بشكل إيجابي أو سلبي على حد سواء ضمن نفس ال مقياس هو Bole‏ تجنب القبول أو التأكيد 
أو التحيز في الموافقة. تشير هذه المصطلحات التي تستخدم بالتبادل إلى ميل المجيب إلى 
الموافقة على البنود بغض النظر عن محتواها ومضمونها. إذا كان المقياسء على سبيل JELI‏ 
يتكون من بنود تعبر عن درجة عالية من تقدير الذات» فإن تحيز القبول قد يؤدي إلى مط 
من الاستجابات التي تبدو وكأنها تشير إلى تقدير للذات مرتفع للغاية. وإذا كان اممقياس 
مكونًا من عدد متساو من البنود ذات الصياغة الإيجابية والسلبيةء فمن ناحية أخرىء يمكن 
التمييز بين تحيز الموافقة والدرجة المتطرفة من تقدير الذات عن بعضهما البعض عن طريق 
نمط الاستجابات. من شأن ”الموافقة“ أن يؤيد البنود التي تشير إلى تقدير الذات العالية 
وا منخفضة على حد سواء. في حين أن الشخص الذي كان يحظى بتقدير كبير io‏ سيؤيد 
بشدة البنود التي تحظى بتقدير كبير ويؤيد بصورة سلبية البنود GIS‏ التقدير ال منخفض. 

ولسوء الحظء قد يكون هناك تمن يجب دفعه مقابل ghol‏ وتضمين البنود ذات 
الصياغة الإيجابية والسلبية. قد يكون تغيير الاتجاه (تحويل الصياغة السالبة إلى موجبة 
والعكس) في قطبية العناصر مربكة للمستجيبين» خاصة عند ملء استبيان طويل. وفي مثل 
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هذه الحالةء قد يصبح اللمستجيبون في حيرة من أمرهم حول الفرق بين التعبير عن قوة 
اتفاقهم مع جملة (بند) ماء بغض النظر عن قطبيتهاء وبين التعبير عن قوة السمة التي 
يتم قياسها (التقدير. على سبيل المثال). وبصفتي Geb‏ في العلوم الاجتماعية التطبيقية 
فقد رأيت العديد من الأمثلة للبنود التي صيغت في الاتجاه المعاكس تؤدي إلى أداء سيء 
للبنود. على سبيل Jb‏ وصف «ديفيليس وكالاهان» )1993( DeVellis and Callahan‏ 
بديلاً أقصر وأكثر تركيزاً لمؤشر الاتجاهات نحو مرض الروماتيزم (وهو اسم مؤسفه OV‏ 
الأداة لا تقيّم الاتجاه ولا تعد مؤشرًا). لقد اخترنا بنوداً من النسخة الأصلية والأطول بناءً 
على poles‏ تجريبية وانتهى بنا الأمر إلى أربعة بنود تعبر عن ردود الفعل السلبية على 
المرض وأحدهم يعبر عن القدرة على مواجهة (التغلب على) امرض بشكل جيد. وكان 
القصد من ذلك هو أن يقوم المستخدمون بعكس درجة تسجيل بند ”المواجهة“ بحيث 
تكون جميع البنود معبرة عن الشعور بالعجز. وف الآونة الأخيرة. درس «كوري »كالاهانء 
وديفيليس» )2002( sloi Currey, Callahan, and DeVellis‏ هذا العنصر الفردي الذي 
صيغ في الاتجاه الإيجابي. وقد كان أداؤه ضعيفاً (منخفضا) باستمرار. وعندما تمت إعادة 
صياغة البند ببساطة عن طريق إضافة كلمة (لا) لتغيير تكافؤه بحيث يكون متسقاً مع 
البنود الأخرى» فقد تحسن أداؤه بشكل كبير. ونعتقد أنه على الرغم من إدراك العديد 
من المجيبين للتكافؤ المختلف للبند الأصليء إلا أن آخرين م يدركوا ذلك. ومن شأن ذلك 
أن يؤدي إلى وجود نسبة من الأفراد الذين أكدوا الارتباطات الإيجابية مع البنود الأربعة 
الأخرى ونسبة أخرى لهم نفس الارتباطات السلبية. ونتيجة UU‏ بالنسبة للعينة JSS‏ 
فإن الارتباطات بين هذا البند والبنود الأربعة الأخرى سوف تتضاءل أو تنخفض بشكل 
ملحوظء lbg‏ سوف ينتج نوع الأداء غير ال مرضي الذي لاحظناه بالنسبة للبند AM‏ 
عكس بند التكافؤ. توحي لي التجربة أو الخبرة الشخصية مع العينات المعتمدة على 
المجتمع المحلي أن عيوب ومساوئ البنود التي صيغت في اتجاه معاكس تفوق أي فوائد. 


الخلاصة: 


يجب أن يكون تجمع pool‏ البنود مصدراً Ge‏ هكن أن ينشأ منه مقياس. وينبغي أن 
يتضمن عدداً كبيراً من البنود ذات الصلة بالمحتوى موضع الاهتمام. التكرار فيما يتعلق 
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با محتوى هو أصلء وليس التزام. وهو أساس ثبات الاتساق الداخلي الذي هوء بدوره, 
أساس الصدق. وينبغي ألا تنطوي البنود على ”صفقة شاملة أو مجموعة مقاييس“ تجعل 
من المستحيل على المجيبين تأييد جزء من البند دون تأييد جزء آخر قد لا يكون متسقاً مع 
الجزء الأول. سواء تم تضمين البنود GIS‏ الصياغة الإيجابية والسلبية في تجمع البنود أم Y‏ 
فإن صياغتها يجب أن تتبع القواعد اللغوية المعمول بها. وسوف 55 ذلك على تجنب 
بعض مصادر الغموض التي نوقشت أعلاه. 


الخطوة الثالثة: تحديد شكل أو تنسيق القياس: 

توجد أشكال وصيغ عديدة للأسئلة. يجب على الباحث أن يفكر مبكراً في الشكل الذي 
سيكون عليه المقياس. وينبغي أن تحدث هذه الخطوة بشكل متزامن مع عملية توليد 
وإنشاء البنود بحيث يتم التوافق بين الاثنين. على سبيل Sb‏ قد يكون إنشاء وتكوين 
قائمة طويلة من العبارات التوضيحية مضيعة للوقت إذا كان شكل الاستجابة الذي وقع 
عليه الاختيار في نهاية المطاف عبارة عن قائمة مرجعية مؤلفة من بنود مكونة من كلمة 
واحدة. علاوة على ذلك» النماذج النظرية المقدمة في وقت سابق هي أكثر اتساقاً مع بعض 
صيغ أو أشكال الاستجابة من lagè‏ وبصفة OB dole‏ المقاييس التي تتكون من بنود ALB‏ 
للتسجيل على مقياس متصل ويتم تجميعها لتشكل درجة المقياس هي الأكثر توافقاً مع 
التوجه النظري الوارد في هذا الكتاب. ومع WS‏ سأناقش في هذا القسم الأشكال والصيغ 
الشائعة التي تختلف عن النمط الذي تتضمنه النماذج النظرية التي تمت مناقشتها في 
الفصل الثاني وكذلك الأشكال التي تتقيد بهذا النمط. 


مقياس ترستون :(Thurstone)‏ 

هناك ous‏ من الإستراتيجيات العامة لبناء المقاييس تؤثر على شكل البنود وخيارات 
الاستجابة. إحدى هذه ee‏ هي مقياس «ثورستون»1111156026'. قد يساعد 
التشبيه على توضيح Las S‏ عمل مقياس ”ثورستون“ . تم تصميم شوكة رنانة لتهتز بتردد 
معين. إذا قمت ا فإنها ستهتز في هذا التردد وستؤدي إلى إصدار نغمة معينة. 


وعلى العكس من US‏ إذا وضعت الشوكة بالقرب من مصدر نغمة ينتج نفس تردد 
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شوكة الرنين» تبدأ الشوكة بالاهتزاز. بمعنى أن الشوكة الرنانة عبارة عن ”جهاز كشف 
تردد“ تهتز في وجود Glogs‏ صوتية من التردد الرنان وتظل بدون حركة في وجود كل 
الترددات الأخرى. تخيل سلسلة من الشوكات الرنانة المرتبة في مصفوفة ما بحيث Lus‏ 
يتحرك إحداها من اليسار إلى اليمين على طول ال مصفوفة. تتوافق الشوكات الرنانة مع 
أصوات التردد الأعلى تدريجيًا. ضمن نطاق تردد الشوكة الرنانة» يمكن استخدام هذا 
الترتيب لتحديد تردد النغمة. وبعبارة أخرىء يمكنك تحديد تردد النغمة من خلال رؤية 
أي شوكة تهتز عند تشغيل النغمة. إن مقياس «ثورستون» تم إعداده ليعمل بنفس 
الطريقة. يحاول واضع ومطور المقياس توليد وإنشاء بنود تستجيب بشكل متفاوت 
Dh gruh‏ معينة من السمة ا معنية. عندما تتطابق «درجة» بند معين مع مستوى السمة 
التي يمتلكها المجيبء فإن هذا البند سيشير إلى هذا التطابق. وفي كثير من OLE‏ 
تتألف الإشارة من استجابة إيجابية للبنود التي يتم «ضبطها» على المستوى المناسب من 
السمة واستجابة سلبية لجميع البنود الأخرى. oleg‏ ما يتم تحديد عملية الضبط (أي 
تحديد مستوى المفهوم البنائي الذي يستجيب له كل بند) عن طريق قيام المحكمين بوضع 
مجموعة كبيرة من البنود في مجموعات تقابل بفواصل أو فترات زمنية متساوية من حيث 
أهمية ا مفهوم البنائي أو قوته. 

هذه فكرة ممتازة للغاية. ويمكن تطوير البنود لتتوافق مع درجات شدة مختلفة من 
dou!‏ ويمكن أن تكون متباعدة بحيث تمثل فواصل أو فترات متساويةء ويمكن تنسيقها 
وصياغتها باستخدام خيارات الاستجابة موافق وغير موافق» على سبيل JE‏ ويمكن 
للباحث إعطاء هذه البنود للمجيبين ثم يفحص إجاباتهم لمعرفة البنود التي أدت الى 
الاتفاق. ونظراً OV‏ البنود ستتم معايرتها مسبقًا فيما يتعلق بحساسيتها لمستويات محددة 
من الظاهرةء فإن الاتفاقات ستحدد مقدار السمة التي lig‏ ا مجيب. قد يؤدي اختيار 
البنود التي تمثل فترات متساوية عبر البنود إلى خصائص قياس مرغوب فيها للغاية لأن 
الدرجات ستكون قابلة للإجراءات الرياضية القائمة على القياس الفتري أو المسافي. 


قد يبدو جزء من مقياس «ثورستون» الافتراضي لقياس تطلعات الآباء للتحصيل التعليمي 
والوظيفي لأطفالهم كما يلي: 
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- تحقيق النجاح هو السبيل الوحيد لطفلي أن يسدد الجهود | موافق .... | غير موافق .... 
التي بذلتها كوالد. 

- الذهاب إلى كلية جيدة والحصول على عمل جيد Jol‏ مهم | موافق .... | غير موافق .... 
ولكن ليس ضرورياً لسعادة طفلي. 


- السعاذة ليست لها علاقة بتحقيق الأهداق التعليمية أو | موافق .... 
- زخارف النجاح ذات القيمة المعتادة ليست عائقاً أمام | موافق .... أغير موافق .... 
السعادة الحقيقية. 


وكما يشير نونالي )1978( Nunnally‏ فإن تطوير مقياس ثورستون حقيقي وصحيح 
أصعب بكثير من وصفه. وأنه من الصعب للغاية العثور على البنود التي «يتردد صداها» 
باستمرار على مستويات محددة من هذه الظاهرة. وغالباً ما تفوق المشاكل العملية 
ا مرتبطة بهذه الطريقة مزاياها ما م يكن لدى الباحث سبب مقنع لرغبته في نوع ا معايرة 
التي يوفرها. على الرغم من أن مقياس «ثرستون» هو طريقة أو نهج مثير للاهتمام 
ومناسب في بعض الأحيانء إلا أنه لن تتم الإشارة إليه في بقية هذا الكتاب. ومع Bey US‏ 
أن الأساليب القائمة على نظرية استجابة البندء التي تمت مناقشتها في فصل لاحق» تشترك في 
العديد من أهداف مقياس «ثورستون» مع اتباع نهج مختلف إلى حد ما لتحقيقها. 





(Guttman) جتمان‎ whio 


مقياس «جتمان» Guttman‏ هو سلسلة من البنود التي تؤثر تدريجياً على مستويات 
أعلى من السمة. di Sag‏ ينبغي للمجيب أن يؤيد ويوافق على مجموعة من البنود 
المتجاورة إلى أن يتجاوزء عند نقطة حرجة» مقدار السمة التي تستخدمها البنود ويمتلكها 
الشخص. ولا يجب تأييد وإقرار أي من البنود المتبقية. وتتوافق بعض البيانات الوصفية 
البحتة مع مقياس ”جتمان“. على سبيل JEL‏ قد تطرح سلسلة من أسئلة ALLEL!‏ ”هل 
تدخن؟“ ”هل تدخن أكثر من ٠١‏ سجائر في اليوم؟“ ”هل تدخن أكثر من علبة سجائر في 
اليوم؟“ وهكذا. كما هو الحال في هذا ELI‏ فإن إقرار أي بند محدد على مقياس ”جتمان“ 
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يعني ضمنياً تأكيد جميع البنود السابقة. ويشير أعلى بند يعطي رداً إيجابياً إلى مستوى 
السمة الذي يمتلكه ا مجيب. aÍ hoy‏ في حين أن IS‏ من مقياس Thurstone«ggiwyi»‏ 
ومقياس ”جتمان“ GU SuGuttman‏ من بنود متدرجة» فإن pS!‏ ينصب على استجابة 
إيجابية واحدة في الحالة الأولى» ولكن في الحالة الأخيرة ينصب التركيز على نقطة الانتقال 
أو التحول من الاستجابات الإيجابية إلى السلبية في الحالة الأخيرة. قد تبدو نسخة مقياس 
”جتمان“ من مقياس الطموح الأبوي السابق كما ياي: 


ا 
كوالد. 


- الذهاب إلى كلية جيدة والحصول على عمل جيد Jel‏ مهم | موافق .... | غير موافق .... 
ولكن ليس ضرورياً لسعادة طفلي. 


Cu Solel -‏ لها علاقة gainers‏ الأهداف التعليفية أو | موافق sae‏ 
BLS; -‏ النجاح ذات القيمة المعتادة ليست عائقاً أمام | موافق .... أغير موافق .... 
السعادة الحقيقية. 





يمكن أن تعمل مقاييس ”جتمان“ بشكل جيد للحصول على معلومات موضوعية أو في 
الحالات التي يكون فيها الضرورة المنطقية هي أن الاستجابة الإيجابية لمستوى واحد من 
التسلسل الهرمي تعني استيفاء معايير جميع المستويات الأدنى من هذا التسلسل الهرمي. 
وتصبح الأمور أكثر غموضاً عندما لا تكون الظاهرة محل الاهتمام ملموسة. وفي حالة 
مقياسنا الافتراضي عن الطموح الأبويء على سبيل SEL‏ قد لا يكون الترتيب موحدًا بين 
الأفراد. في حين أن تدخين ٠١‏ سيجارة ف اليوم تعني دانماً تدخين أكثر من ١٠سجائرء‏ والردود 
على البندين رقم (P)‏ ورقم (E)‏ في مثال مقياس الطموح الأبوي قد لا تتوافق دائماً مع مط 
الترتيب في مقياس «جتمان». فعلى سبيل JELI‏ قد يوافق الشخص على البند رقم (Y)‏ ولكنه 
لا يوافق على البند رقم .)٤(‏ ومن الطبيعيء أن تنطوي ال موافقة على البند رقم (Y)‏ الموافقة 
على البند رقم (E)‏ ولكن IS!‏ رأى المجيب أن النجاحَ عامل معقد أو مركب يعمل في آن واحد 
كمساعد وعائق doled! elf‏ فإن ذلك قد يسفر عن hë‏ غير gole‏ من الاستجابات. 
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مثل مقياس «ثورستون». OB‏ مقياس «جتمان» بلا شك له مكانته» ولكن إمكانية 
تطبيقهما تبدو محدودة إلى حد ما. ومع كلا النهجين أو النوعين من المقاييس, WE‏ 
ما تفوق المساوئ والمصاعب المزايا. ومن امهم أيضاً التأكيد من جديد على أن نظريات 
القياس التي تمت مناقشتها حتى الآن لا تنطبق دائماً على هذه الأنواع من المقاييس. ومن 
المؤكد أن افتراض وجود علاقات سببية قوية بنفس القدر بين المتغير الكامن وكل بند من 
البنود لن ينطبق على مقياس «ثورستون» أو مقياس «جتمان». يصف «نونالي وبرنشتاين» 
Nunnally and Bernstein (1994)‏ بإيجاز Las:‏ من النماذج المفاهيمية التي تستند إليها 
هذه المقاييس. أما بالنسبة للحالات التي تكون فيها البنود المرتبة Ladle‏ بشكل خاصء فإن 
النماذج المستندة إلى نظرية استجابة البند (التي تمت مناقشتها في الفصل السابع) قد تكون 
خياراً مناسباً على الرغم من أن تنفيذ هذه الأساليب يمكن أن يكون مرهقاً للغاية. 


المقاييس ذات البنود متساوية الترجيح أو الوزن: 

تتناسب نماذج القياس التي تمت مناقشتها سابقًا بشكل أفضل مع المقاييس التي تتكون 
من بنود تعادل الى حد ما «أجهزة كشف» للظاهرة محل الاهتمام - أي إنها متكافئة بدرجة 
أو بأخرى (ولكنها ليست متكافئة بالضرورة با معنى الدقيق لنموذج الاختبارات المتوازية 
«المتكافئة»). وهي مؤشرات غير كاملة لظاهرة مشتركة يمكن دمجها عن طريق الجمع 
البسيط في مقياس يتمتع بالثبات إلى حد مقبول. 

وهناك ميزة واحدة جذابة للمقاييس من هذا النوع هي أن كل بند من البنود على 
حدة يمكن أن يكون له مجموعة متنوعة من أشكال وتنسيقات خيارات الاستجابة» وهذا 
يتيح ممطور المقياس قدراً كبيراً من المدى أو الطول في إنشاء مقياس مناسب بشكل مثالي 
للغرض المحدد. وسيتم olol‏ بحث بعض القضايا والمشكلات العامة المتعلقة بشكل وصيغة 
الاستجابةء وكذلك بحث مزايا وخصائص بعض أشكال وصيغ الاستجابة النموذجية. 


كم عدد فئات الاستجابة؟ 


تتكون معظم بنود المقياس من جزأين هما: جذع أو ساقء وسلسلة من خيارات 
الامتجابة (السلم). على سبيل JGL‏ قد يكون الساق لكل بند فقرة توضيحية وتفسيرية 
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مختلفة يعبر عن رأي ماء وقد تكون خيارات الاستجابة المصاحبة لكل ساق عبارة عن سلسلة 
من الأوصاف التي تشير إلى قوة الاتفاق مع البند. دعونا نركز الآن على خيارات الاستجابة 
- وعلى وجه التحديد» عدد الخيارات التي ينبغي أن تكون متاحة للمجيب. تسمح بعض 
أشكال وصيغ استجابة البنود للشخص بوجود عدد لا نهائي أو كبير le‏ من الخيارات» 
في حين أن بعضها الآخر يحد من الاستجابات ال محتملة. تخيلء على سبيل المثال» تدريج 
الاستجابة لمقياس الغضب الذي يشبه مقياس الحرارة» تمت معايرته من Y»‏ غضب على 
الإطلاق» في قاعدة المقياس إلى «الغضب التام الذي لا هكن السيطرة عليه» في قمته. ويمكن 
تقديم مجموعة من توصيفات الحالة أو الموقف إلى المجيب» مصحوبة كل منها بنسخة 
من المقياسء ويطلب منه أن يبينء عن طريق التظليل في جزء من امقياس» مدى أو مقدار 
الغضب الذي تثيره الحالة أو الموقف. تسمح هذه الطريقة بالقياس المتصل «ا مستمر» 
للغضب Led‏ وقد تطلب طريقة بديلة من المجيب أن يبينء باستخدام رقم يتراوح بين 
درجة واحدة و١٠٠‏ درجة» مدى ومقدار الغضب الذي يسببه له كل موقف أو حالة. وهذا 
يوفر العديد من الاستجابات المنفصلة. وبدلاً من US‏ قد يؤدى الشكل أو التنسيق إلى 
تقييد خيارات الاستجابة إلى عدد قليل من الخيارات» مثل Yo‏ شيء» أو «قليلاً» أو «مقدار 
معتدل أو متوسط» و«كثيرآ» أو إلى اختيار GUS‏ بسيط بين «غاضب» و«غير غاضب». 

ما هي المزايا النسبية لهذه البدائل؟ sol‏ خصائص النوعية أو الجودة المرغوب فيها 
لتدريج القياس هو الاختلاف والتباين. فالمقياس لا يمكن أن يكون متبايناً إذا م يختلف أو 
يتغير. وإذا فشل مقياس ما في التمييز بين الاختلافات في السمة الأساسية» فإن ارتباطاته 
بالمقاييس الأخرى ستكون مقيدة وسوف تكون فائدته محدودة. ومن بين الطرق لزيادة 
فرص التباين هي ghol‏ وتضمين المقياس عدداً كبيراً من البنود. ومة خيار آخر يتمثل في 
توفير خيارات عديدة للاستجابة في إطار البنود. إذا اضطرت الظروف الباحث إلى أن يقتصر 
على سؤالين فقط يتعلقان بقياس الغضب. على سبيل المثالء فقد يكون من الأفضل السماح 
للمجيبين بمزيد من حرية التعبير في وصف مستوى غضبهم. افترض أن البحث يتعلق 
بتطبيق سياسات عدم التدخين في بيئة العمل. ولنفترض كذلك أن الباحثين يريدون تحديد 
العلاقة بين هذه السياسة والغضب. إذا كانت تقتصر على سؤالين فقط (على سبيل JELI‏ 
Lo»‏ مقدار الغضب الذي تشعر به عندما يتم حظرك من التدخين؟» و«ما مقدار الغضب 
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الذي تشعر به عندما تتعرض للآخرين ممن يدخنون في مكان العمل؟»)ء وقد يحصل 
الباحثون على معلومات أكثر فائدة من صيغ الاستجابة التي تسمح للأشخاص بتدريج 
استجابة أكثر من صيغ الاستجابة الثنائية (على سبيل JELI‏ «غاضب» و«ليس غاضب»). 
فعلى سبيل SLL!‏ قد يكشف مقياس من «صفر» إلى »+ «V+‏ عن اختلافات كبيرة في ردود 
الفعل إزاء هذه الحالات وا مواقف كما قد يؤدي إلى تباین جيد في مقياس مكون من بندين. 
ومن ناحية أخرىء إذا مُمح لفريق البحث بإدراج «Or»‏ سؤالاً عن التدخين والغضب» 
فإن المؤشرات البسيطة «الغاضبة» مقابل pb»‏ الغاضبة» قد تسفر عن تباين كاف Loris‏ 
تضاف gf‏ يتم تجميع og ull‏ للخصول على :ذرجة المقيان. نوق الؤاقع. فإن مواجهة المزيد 
من خيارات الاستجابة بشأن كل سؤال من الأسئلة الخمسين قد تؤدي إلى إرهاق المجيبين 
أو تتسبب في إزعاجهم ومللهم» مما يقلل من ثبات إجاباتهم. 


ägg‏ مسألة أخرى تتعلق بعدد خيارات الاستجابة تتمثل في قدرة المجيبين على التمييز 
بشكل كبير. ما مدى AB‏ التمييز الذي يمكن أن يقوم به الشخص امثالي؟ ومن الواضح 
أن هذا يتوقف على ما يتم قياسه. وهناك عدد قليل من الأشياء يمكن تقييمها حقاً في 0٠‏ 
dis‏ منفصلة. على سبيل JELI‏ مع عرض هذه الخيارات العديدةء قد لا مكن للعديد من 
ا مجيبين استخدام سوى تلك الخيارات المقابلة لمضاعفات العدد خمسة أو عشرة» مما يقلل 
بشكل فعال عدد الخيارات إلى عدد قليل لا يتجاوز خمسة. وقد لا تعكس الاختلافات بين 
استجابة من 0" إلى ۳۷ الفرق أو الاختلاف الفعلي في الظاهرة التي يتم قياسها. ولا يكسب 
هذا النوع من الدقة الزائفة إلا القليل. وعلى الرغم من أن تباين المقياس قد يزدادء فإنه قد 
يكون الجزء العشوائي الذي يتزايد (أي الخطأ) وليس الجزء المنتظم الذي يعزى إلى الظاهرة 
الأساسية. وهذاء بطبيعة الحالء لا يقدم أو يحقق أي فائدة. 

وفي بعض الأحيان» تعتمد قدرة المجيب على التمييز بشكل مفيد بين خيارات الاستجابة 
على الصياغة المحددة لتلك الخيارات أو موضعها (مكانها) المادي. وقد تؤدي مطالبة 
المجيب بالتمييز بين التوصيفات الكمية الغامضة. مثل «عدة» و«قليل» و«كثير» إلى خلق 
مشاكل. في بعض Oke!‏ يمكن تقليل الغموض عن طريق ترتيب خيارات الاستجابة على 
الصفحة. ويبدو أن المجيبين غالبًا ما يفهمون ما هو مرغوب فيه عندما تُعرض عليهم 
سلسلة متصلة واضحة. Why‏ فإن الطلب مثل: 
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وقد يعني هذا ضمنياً أن الخيار «بعض الأحيان» هو أكثر من خيار الاستجابة «قليلاً» بسبب 
ترتيب هذه البنود. ومع ذلك إذا كان من الممكن إيجاد صفة Y‏ لبس فيها تمنع المجيبين 
من وضع افتراضات تستند إلى ال موضع أو OH‏ على طول سلسلة abate‏ فإن هذا يكون 
أفضل بكثير. ds‏ بعض OLE!‏ قد يكون من الأفضل أن يكون لديك عدد من خيارات 
الاستجابة أقل من تلك التي تكون غامضة. UY‏ على سبيل المثال» قد يكون من الأفضل 
في JEL‏ السابق حذف إما «بعض الأحيان» أو SUS»‏ ويكون لديك أربعة خيارات بدلاً 
من خمسة. وأسوأ الظروف هي الجمع بين الكلمات الغامضة ومواقع الصفحة الغامضة. 
فكر في JEL!‏ التالي: 


مفيد جداً Very Helpful‏ غير مفيد جداً Not Very Helpful‏ 
مفيد إلى حد ما Somewhat Helpful‏ | غير مفيد على الأطلاق Not at All Helpful‏ 


ومن الصعب جداً التمييز بين مصطلحات مثل إلى حد ما somewhat‏ ”ولیس إلى حد 
كبير “not very‏ في ظل أفضل الظروف. ومع ذلكء فإن ترتيب خيارات الاستجابة هذه كما 
تظهر أعلاه يجعل الأمور أكثر سوءاً. إذا قام المجيب بقراءة العمود الأول ثم أسفل العمود 
«SWI‏ فيبدو أن تعبير ”إلى a>‏ ما “somewhat‏ ثل قيمة cl‏ من تعبير ”ليس إلى حدٍ كبير 
“not very‏ ولكن إذا قرأ المجيب الصف الأول ثم عبر الصف الثاني» فإن الترتيب الضمني 
لهذين الاستجابتين الواصفتين على طول سلسلة متصلة يتم عكسه. ونظرًا للغموض الذي 
يكتنف WS‏ من الترتيب اللغوي والترتيب GAI‏ يمكن للأفراد أن يعطوا معاني مختلفة 
للخيارين a ri‏ قيمتين معتدلتين» وكنتيجة UL‏ فإن الثبات سيتأثر. 





بنذ إذا 5 المتخدام طريقة مقياس الخرارة التي تم وصفها سارعا لتعديد الاسعجابات الكمية 
gilts gle‏ اف »فيل نج عاو الا ماف E‏ وقيقة لكل اا ا 
هي الدقة المناسبة؟ هل يمكن قياس المنطقة المظللة في حدود ربع بوصة؟ سنتيمتر؟ مليمتر؟ 
إذا تم استخراج بعض البيانات الخام فقط - مثل الثلث الأدنى أو الأو سط أو he‏ دمن 
المقياس» فما هي النقطة التي كانت عندها المطالبة بمثل هذه الاستجابة الدقيقة؟ 
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وهناك مسألة أو مشكلة أخرى على الأقل تتعلق بعدد الردود أو الاستجابات. على 
افتراض السماح بعدد قليل من الإجابات المنفصلة لكل بند. هل ينبغي أن يكون عدد 
الردود أو الاستجابات فردياً أم زوجياً؟ ومردً 551« يعتمد هذا على نوع السؤالء ونوع خيار 
الاستجابة» وغرض أو هدف الباحث. وإذا كانت خيارات الاستجابة ثنائية القطب. حيث 
يشير أحد القطبين إلى عكس القطب الآخر (على سبيل JEL‏ اتجاه إيجابي قوي مقابل 
اتجاه سلبي قوي). فإن Bae‏ فرديًا من الردود والاستجابات يسمح (بالمراوغة) بالغموض 
cls) uly‏ سبيل JELI‏ ”لا أتفق ولا أعارض (“neither agree nor disagree‏ أو عدم 
اليقين أو عدم التأكد He)‏ سبيل JL‏ ”غير متأكد“)؛ Boles‏ لا يسمح العدد الزوجي 
للاستجابات بذلك. وينطوي العدد الفردي للاستجابات على نقطة ”محايدة“ مركزية (على 
سبيل SLL‏ لا تقييم إيجابي ولا سلبي). من ناحية أخرى» هناك عدد زوجي من الردود 
أو الاستجابات يجبر المجيب على أن يقدم على الأقل التزاماً ضعيفاً في اتجاه أحد الطرفين 
أو الطرف الآخر(مثل الاختيار القسري بين التقييم الإيجابي إلى حد ما أو التقييم السلبي 
إلى حد ما باعتباره الرد الأقل تطرفاً). ولا يكون أي من الشكلين متفوقاً بالضرورة. وقد 
يرغب الباحث في منع (المراوغة) الغموض واللبس إذا كان هناك شعور GL‏ الأشفخاص 
سيختارون استجابة محايدة كوسيلة لتجنب الاختيار. ففي الدراسات المتعلقة بخيارات 
ا مقارنة الاجتماعية. على سبيل SUL‏ قد يرغب الباحثون في إجبار الأشخاص على التعبير 
عن تفضيلهم للحصول على معلومات حول الشخص الذي يتمتع بقدر أكبر من المزايا أو 
بقدر أقل من المزايا. لننظر في هذين الشكلين البديلينء الأول الذي تم اختياره لدراسة 
امقارنات الاجتماعية بين ال مصابين بالتهاب المفاصل )1990 :(DeVellis et al.,‏ 
-١‏ هل تفضل معلومات حول: 

)1( المرضى الذين يعانون من التهاب المفاصل أسوأ مما لديك. 

(ب) المرضى الذين يعانون من التهاب المفاصل أكثر اعتدالاً مما لديك. 
-Y‏ هل Ladi‏ معلومات حول: 

)1( المرضى الذين يعانون من التهاب المفاصل أسوأ مما لديك. 

(ب) المرضى الذين يعانون من التهاب المفاصل بنفس القدر الذي تعاني منه. 

(ج) ا مرضى الذين يعانون من التهاب المفاصل أكثر اعتدالاً مما لديك. 
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قد يسمح خيار محايد مثل رقم Y‏ (ب) بامراوغة (اللبس والغموض) غير ا مرغوب 
فيها. وقد يكون من المطلوب وا مستحسن أيضاً وجود نقطة محايدة. في دراسة تقييم 
أي نوع من المخاطر (على سبيل JEL!‏ ا ملل مقابل الخطر) الذي يفضله الناس» قد تكون 
نقطة الوسط ضرورية أو حاسمة. قد يغير الباحث فرصة أو شدة الضرر عبر عدة خيارات 
بين نشاط آمن وممل ونشاط pio‏ ومحفوف بال مخاطر. ويمكن عندئذ استخدام النقطة 
التي يكون فيها المجيب ملتبساً إلى أبعد حد بشأن ا مخاطرة بالنشاط الأكثر إثارة كمؤشر 
للمخاطرة: 

يرجى الإشارة إلى تفضيلك النسبي للنشاط (i)‏ أو النشاط (ب) من بين البدائل المدرجة 
أدناه من خلال وضع دائرة حول العبارة المناسبة بعد وصف النشاط (ب). 


النشاط (أ): قراءة كتاب Y) Glas!‏ توجد فرصة لحدوث إصابة شديدة). 


-١‏ النشاط(ب): القيام برحلة جوية في طائرة ركاب صغيرة (احتمال ضئيل جداً بحدوث 
إصابة بالغة). 





؟- النشاط (ب): القيام برحلة على متن طائرة صغيرة في قمرة القيادة (فرصة طفيفة 
للإصابة الشديدة). 





النشاط Å‏ | معتدل النشاط (i)‏ 
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-٤‏ النشاط (ب): القفز با مظلة من طائرة بدون مظلة احتياطية (خطر كبير من الإصابة 
الشديدة). 





0- النشاط (ب): القفز من طائرة بدون مظلة ومحاولة الهبوط على Bim‏ ناعم (إصابة 
خطيرة مؤكدة تقريباً). 
أفضل بشكل 


معتدل النشاط (i)‏ 





وبصرف النظر عن Lob!‏ أو الالتزامات الأخرى لهذا النهج أو الأسلوبء فإنه يتطلب 
بوضوح أن تتضمن خيارات الاستجابة نقطة وسط أو نقطة منتصف. 


elgi‏ محددة (معينة) من أشكال وتنسيقات الاستجابة: 


تظهر بنود المقياس في مجموعة متنوعة من الأشكال والصيغ المثيرة. ومع WS‏ هناك 
عدة طرق لعرض وتقديم البنود التي يتم استخدامها على نطاق واسع وأثبتت نجاحها في 
تطبيقات متنوعة. ونناقش أدناه بعض هذه المسائل. 


مقياس ليكرت: 

يعد مقياس «ليكرت» Likert scale‏ أحد الأشكال والصيخ الأكثر شيوعاً للبنود. وعند 
استخدام مقياس ”ليكرت“ يتم عرض البند كجملة تفسيرية»ء تليها خيارات استجابة تشير 
إلى درجات مختلفة من GYI‏ مع العبارة أو تأييدها. (في الواقع» كان JEL!‏ السابق عن 
المخاطرة يستخدم شكل وصيغة استجابة مقياس ليكرت). وتبعاً للظاهرة التي يجري 
دراستها وأهداف الباحث» فقد يصاحب كل بند be]‏ عدد فردي أو عدد زوجي من خيارات 
الاستجابة. وينبغي صياغة خيارات الاستجابة بحيث تكون لها فترات متساوية تقريباً فيما 
يتعلق بالاتفاق. وهذا يعني أن الفرق في الاتفاق بين أي زوج متجاور من الإجابات يجب 
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أن يكون مماثلاً تقريباً لأي زوج متجاور آخر من خيارات الاستجابة. ومن الممارسات 
الشائعة ghol‏ ستة ردود أو استجابات محتملة هي: nd»‏ موافق بشدة»» و«غير موافق 
إلى حد ما». و«غير موافق بشكل معتدل أو متوسط» و«موافق بشكل معتدل أو متوسط» 
و«موافق إلى حد cule‏ و«موافق بشدة». وهذا يشكل سلسلة متصلة من عدم الاتفاق 
بشدة إلى GAYI‏ بشدة. هكن أيضاً إضافة نقطة h wg‏ أو منتصف محايدة. وتشمل 
الخيارات الشائعة لنقطة الوسط «لا أوافق ولا أعارض» و«موافق وغير موافق بالتساوي 
(سيان)». فهناك مجال مشروع للمناقشة فيما يتعلق بتكافؤ هاتين النقطتين المتوسطتين. 
الأول يعني ضمنياً عدم الاكتراث SILMI‏ في حين يشير الأخير إلى وجود جاذبية قوية 
ولكنها متساوية لكل من الاتفاق وعدم الاتفاق. وقد يكون الأمر جيدًا أن معظم المجيبين 
لا يركزون كثيراً على الفروق الدقيقة في AI‏ بل يعتبرون مجرد LS‏ الاستجابة المعقول في 
hug‏ النطاق كنقطة وسط أو منتصف» بصرف النظر عن صياغته الدقيقة. 

يستخدم مقياس «ليكرت» على نطاق واسع في أدوات قياس الآراء والمعتقدات 
والاتجاهات. ومن المفيد WE‏ أن تكون هذه العبارات قوية إلى do‏ ما (وإن م تكن قوية 
(GLU‏ عند استخدامها في شكل وصيغة مقياس ليكرت. ومن المفترض أن يتم التعبير عن 
الاعتدال في الرأي في اختيار خيار الاستجابة. على سبيل SEL!‏ العبارات التالية: «يتجاهل 
الأطباء عمومًا ما يقوله المرضى»». و«في بعض الأحيانء لا يولي الأطباء القدر من الاهتمام 
الذي ينبغي لتعليقات المرضى»» و«مرة واحدة من حين لآخرء قد ينسى الأطباء أو يفوتهم 
شيئ ما أخبرهم به المريض» هي تعبر عن آراء قوية وآراء معتدلة وآراء ضعيفةء على التواليء 
في ما يتعلق بعدم اهتمام الأطباء بتعليقات المرضى. أيهم يكون أفضل مقياس «ليكرت»؟ 
في نهاية اممطاف» بطبيعة led‏ فإن الذي يعكس الاختلافات الحقيقية في الرأي بشكل 
أكثر دقة يكون هو الأفضل. عند اختيار مدى قوة الصياغة في تجمع U5]‏ للبنود. قد يكون 
من المفيد أن يتساءل الباحث عن «الطريقة التي من المحتمل أن يجيب بها الناس الذين 
لديهم polis‏ أو نقاط قوة مختلفة في السمة المعنية» Go‏ حالة الأمثلة الثلاثة المقدمة 
للتوء فإن الباحث قد يستنتج أن السؤال الأخير Ley‏ قد يؤدي إلى التوصل إلى اتفاق قوي 
على الأرجح من جانب الأشخاص الذين تندرج آراؤهم على امتداد جزء كبير من السلسة 
المتصلة من الإيجابية إلى السلبية. وإذا ثبت أن هذا الاستنتاج صحيح» فلن تؤدي العبارة 
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الثالثة دورًا جيدًا في التمييز بين الأشخاص ذوي الآراء السلبية القوية مقابل الآراء السلبية 
المعتدلة (المتوسطة). 
وبصفة dole‏ قد تؤدي العبارات المعتدلة للغاية إلى التوصل إلى اتفاق أكثر مما ينبغي 
عند استخدامها في مقاييس «ليكرت». وسوف يتفق كثير من الناس بشدة مع عبارة مثل 
«سلامة وأمن المواطنين أمر مهم». ويمكن للشخص أن يوافق بشدة على مثل هذه العبارة 
gl)‏ اختيار خيار الاستجابة القصوى) دون إبداء gl)‏ مبالغ فيه. وبطبيعة الحالء فإن العكس 
هو الصحيح بنفس القدر. وقد يجد الأشخاص الذين لديهم أي آراء أكثر تطرفاً أنفسهم في 
خلاف (عدم اتفاق) مع عبارة قوية للغاية (على سبيل المثال» «إن ملاحقة مرتكبي الأفعال 
غير المشروعة ومعاقبتهم eal‏ من حماية حقوق الأفراد»). ومن بين العبارتين (الأكثر اعتدالاً 
والأكثر تطرفاً). فإن الأولى قد تكون هي المشكلة الأكبر لسببين. أولاًء غالباً ما نميل إلى كتابة 
عبارات لا تسيء إلى الناس. إن تجنب الهجوم قد يكون فكرة جيدة. ومع GUS‏ فإنه قد 
يقودنا إلى تفضيل البنود التي سيجدها الجميع تقريبا مقبولة. وهناك سبب آخر يدعو إلى 
الحذر من البنود المعتدلة duc‏ وهو أنها قد تمثل GLE‏ أو عدم وجود الاعتقاد أو الرأي. Lal‏ 
البند الثالث من بنودنا الخاصة بالطبيب الذي لا ينتبه لتعليقات ا مرضى في الفقرة السابقة 
فلم يبين وجود اتجاه إيجابي بقدر ما يدل على عدم وجود اتجاه غير إيجابي. وقد لا تتناسب 
بنود من هذا النوع بدرجة كافية مع هدف البحث لأننا غالباً ما نهتم بوجود ظاهرة ما أكثر 
مما نهتم بعدم وجودها. 
تتمثل إحدى الطرق المفيدة لمعايرة مدى قوة أو اعتدال صياغة عبارة ما في القيام ا 
يلي: تخيل المستجيب العادي الذي يكون هدفاً لتطبيق المقياس. حاول أن تتخيل كيف 
تجيب هذا الشخص على بنود مختلفة من حيث القوة. والآن» فكر في نوع صياغة 
البند الذي من المرجح أن يستخلص إجابة من المجيب العادي الذي كان في مركز خيارات 
الاستجابة لمقياس «ليكرت» والذي تخطط لاستخدامه أو بالقرب منه. لذلك» على سبيل 
المثالء إذا اخترت LAL‏ ذا تدريج مكون Go‏ نقاط وكان فيه خيار الاستجابة المركزي 
(الوسط) هو «غير موافق قليلاً وموافق «SLL‏ فإنك تريد تكوين بند يستخلص إحدى هذه 
الاستجابات من مجيب gole‏ في المجتمع الإحصائي محل الاهتمام. وينبغي أن يكون مثل 
هذا البند قادرًا على استيعاب الأشخاص الذين تكون وجهات نظرهم (آراؤهم) Le]‏ أقل 
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أو أكثر قوة من المجيب العادي أو المتوسط, وبالتالي ينبغي من الناحية النظرية أن يكون 
لديهم تباين كبير في الدرجة الملاحظة والدرجة الحقيقية. وبفضل التباين بين المجيبين» ستتاح 
للبند فرصة أفضل للارتباط بشكل جيد مع البنود الأخرى (لأن التباين المشترك «التغاير» 
مرتبط بمدى التباين) وبالتالي سيكون لديه القدرة على تعزيز ثبات المقياس. وعلى النقيض 
من US‏ فإن البند الذي من المحتمل أن تنتج dis‏ استجابات شديدة «متطرفة أو مبالغ 
فيها»» مثل عدم الموافقة بشدة أو الموافقة بشدة. من المجيب العاديء سوف يؤدي Sas‏ 
ضعيفاً في التمييز بين مختلف الفئات الكاملة من ال مجيبين. 

باختصار. يجب أن يوضح بند مقياس ”ليكرت“ الجيد الرأي أو الاتجاه أو المعتقد أو 
أي مفهوم Gly‏ آخر قيد الدراسة بعبارات واضحة. وليس من الضروري ولا من المنااسب 
أن يمتد هذا النوع من المقياس إلى نطاق التأكيدات الضعيفة إلى تأكيدات قوية للمفهوم 
البنائي. توفر خيارات الاستجابة الفرصة للتدرجات. 


فيما يلي أمثلة للبنود بصيخ وأشكال استجابة مقياس «SSI»‏ 


-١‏ تعتبر ممارسة التمارين الرياضية عنصراً أساسياً في hè‏ حياة صحي. 
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القياس التفاضلى الدلالى (تباين الدلالات اللفظية): 


ترتبط طريقة القياس التفاضلي الدلالي بشكل رئيسي ببحوث الاتجاه التي أجراها 
«أوسقود وزملاؤه» (على سبيل المثال. 1955 goleg (Osgood & Tannenbaum,‏ 
ما يستخدم تباين الدلالات اللفظية في الإشارة إلى واحد أو أكثر من الدوافع أو المحفزات. 
ففي حالة الاتجاهات» على سبيل Sb!‏ قد يكون الحافز أو الدافع هو مجموعة من الناسء 
مثل مندوبي مبيعات السيارات. ويتبع تحديد الدوافع والحوافز المستهدفة قائمة بأزواج 
الصفات. هثل كل زوج طرفي نقيض من سلسلة dilate‏ محددة بالصفات de)‏ سبيل 
LU!‏ أمين أو Golo‏ وغير أمين). كما هو موضح في obo) JELI‏ هناك عدة نقاط (سطور) 
بين الصفات التي تشكل خيارات الاستجابة: 


مندوب مبيعات السيارات: 





في الأساس» تمثل الخطوط الفردية (سبعة وتسعة أرقام مشتركة) نقاطًا على طول السلسلة 
المتصلة المحددة بواسطة الصفات. يضع ا مجيب علامة أو إشارة على أحد الخطوط للإشارة 
إلى النقطة الموجودة على طول السلسلة المتصلة التي يتسم بها تقييمه للحافز أو الدافع. 
على سبيل المغال» إذا كان شخص ما piss‏ مندوب مبيعات السيارات غير أمين ALU‏ فقد 
يختار هو أو هي الخط الأقرب إلى تلك الصفة. يمكن التعبير عن وجهات النظر والآراء 
ا لمتطرفة أو المعتدلة من خلال اختيار الخط الذي يجب وضع علامة علية. بعد تقييم 
الدوافع ”الحوافز“ فيما يتعلق بزوج الصفة الأول ينتقل الشخص إلى أزواج صفة إضافية 
مفصولة بخطوط. 

إن الصفات التي يختارها الشخص قد تكون إما ثنائية القطب أو أحادية ball‏ 
اعتمادًا. كما هو الحال lo‏ على المنطق الذي تستند إليه الأسئلة البحثية التي يهدف 
المقياس إلى معالجتها. كل الصفات ثنائية القطب تعبر عن وجود سمات متناقضة, 
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مثل الودية friendly‏ والعدائية hostile‏ وتشر أزواج الصفات أحادية القطب إلى وجود 
dow‏ واحدة وعدم وجودها (غيابها)» Jio‏ الودية friendly‏ وغير الودية. 

كما هو الحال مع مقياس ”ليكرت“ يمكن أن يكون شكل وصيغة الاستجابة التفاضلية 
الدلالية متوافقًا إلى حد كبير مع النماذج النظرية التي تم عرضها في الفصول السابقة من هذا 
الكتاب. يمكن كتابة مجموعات من البنود للاستفادة من نفس المتغير الأساسي. على سبيل 
المثالء هكن إضافة البنود التي تستخدم نقاط النهاية التاليةء جدير ET‏ بالثقة, 
وعادل / وغير عادل» وصادق / غير Golo‏ كنقاط نهاية إلى العبارة الأولى في JEL!‏ السابق 
بحيث تشكل مقياس ”الشرف أو الأمانة“. ممكن تصور مثل هذا المقياس على أنه مجموعة 
من البنود التي تشترك في متغير كامن مشترك هو (الشرف أو الأمانة) وتتوافق مع الافتراضات 
التي تمت مناقشتها في الفصل الثاني. Flog‏ على US‏ يمكن إضافة وتحليل العشرات من البنود 
كل على حدة «لمقياس الأمانة» على النحو المبين في قسم لاحق فيما يتعلق بتقييم البنود. 


التناظر البصري: 

هناك تنسيق آخر لشكل وصيغة البند يشبه إلى حد ما القياس التفاضلي الدلالي وهو 
مقياس التناظر البصري. يقدم شكل وصيغة الاستجابة هذا للمستجيب (hs‏ متصلاً بين 
زوج من التوصيفات الذي بمثل نهايات على طرفي نقيض (متعاكسة) لسلسلة متصلة. 
ويُطلب من الشخص الذي يكمل البند وضع علامة عند نقطة على الخط تمثل رأيه أو خبرته 
أو معتقده أو أي شيء يتم قياسه. إن مقياس التناظر البصريء كما يوحي مصطلح التناظرية 
في الاسم» هو مقياس مستمر أو متصل. يقوم فيه الباحث بتحديد دقة التمايز في تعيين 
الدرجات إلى النقاط على المقياس. وقد تم في وقت سابق مناقشة بعض مزايا وعيوب شكل 
أو صيغة الاستجابة ا لمستمرة. وهناك مسألة أو مشكلة إضافية م تتم إثارتها في ذلك الوقت 
تتعلق بالاختلافات امحتملة في تفسير المساحة المادية من حيث صلتها بالقيم على المتصل. 
قد لا تعني العلامة الموضوعة في نقطة معينة على طول الخط نفس الشيء بالنسبة لأشخاص 
مختلفين» حتى عندما يتم تمييز نقاط النهاية hal‏ بشكل مماثل لجميع المجيبين. فكر في 
مقياس تناظر بصري GU‏ مثل التالي: 


لا آم على الإطلاق أسوا bl‏ واجهته أو جربته. 
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هل تشير الاستجابة في منتصف المقياس إلى الأم الذي يصيب نصف الوقت» أو ANI‏ 
ا لمستمر بنصف الشدة المحتملة» أو شيء آخر بالكامل؟ جزء من المشكلة مع قياس AMI‏ هو 
أنه يمكن تقييمه على أبعاد متعددة: ها في ذلك التكرارء والشدة. والمدة. كما أن LSS‏ 
أسوأ ألم قد تعرض له شخص ما من ا مرجح أن تكون مشوهة. والواقع أن المقارنات بين 
الأفراد تزداد تعقيداً بفعل حقيقة مفادها أن الأشخاص المختلفين Ley‏ قد تعرضوا لمستويات 
مختلفة من «أسوأ أم». وبطبيعة lod!‏ لا شك أن بعض هذه المشاكل تكمن في الظاهرة 
المستخدمة في هذا JELI‏ - وهي bY!‏ (انظر «كييف» 2000 Keefe,‏ للحصول على مناقشة 
ممتازة لقياس (bY!‏ - وليس مع المقياس في حد ذاته. ومع ذلكء يمكن أن توجد مشكلة 
تعيين للقيم بطريقة غير اعتيادية (عشوائية) على طول مقياس تناظري بصري لظواهر 

ومن المميزات الرئيسية مقاييس التناظر البصري أنها قد تكون حساسة للغاية (مايرء 
(Mayer, 8‏ وهذا من شأنه أن يجعلها مفيدة بشكل خاص في قياس الظواهر قبل 
وبعد وقوع بعض الأحداث ام متداخلةء مثل التدخل أو ال معالجة التجريبية» التي تمارس تأثيراً 
ضعيفاً نسبياً. على سبيل ال مثالء قد لا يؤدي التوبيخ الخفيف أو المتوسط في سياق اللعالجة 
التجريبية إلى إحداث تحول في مقياس لاحترام الذات ذي تدريج خماسي النقاط. ولكن 
رما قد يحدث تحول دقيق ولكنه منهجي أو منتظم يؤدي إلى انخفاض القيم على مقياس 
تناظري بصري بين الناس في حالة «التوبيخ» لهذه التجربة الافتراضية. وقد تكون الحساسية 
أكثر فائدة عند فحص ودراسة التغيرات على مر الزمن داخل نفس الفرد وليس بين الأفراد 
(مايرء 1978 .(Mayer,‏ وقد يكون الأمر كذلك لأنه في الحالة الأولىء لا يوجد خطأ Gla]‏ 
بسبب الاختلافات الخارجية بين الأفراد. 


وهناك ميزة أخرى محتملة لمقاييس التناظر البصري عند تكرارها بمرور الوقت» وهي أنه 
من الصعب أو المستحيل على الأشخاص ترميز «تشفير» إجاباتهم السابقة بدقة. بالاستمرار 
في ا مثال الوارد في الفقرة السابقةء رها لا يجد شخص ما صعوبة كبيرة في تذكر أي من 
الخيارات الخمسة المرقمة بالنسبة لبند تقدير الذات الذي كان قد اختاره أو اختارته من 
قبل استجابة لشكل أو صيغة متعددة الاستجابات مثل مقياس «ليكرت». إلا أنه ما م يتم 
اختيار إحدى نقاط النهاية ممقياس تناظر بصري» سيكون من الصعب أن نتذكر بدقة اممكان 
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الذي تم فيه وضع علامة على طول خط غير مميز. وقد يكون ذلك مفيدًا إذا كان الباحث 
يشعر بالقلق من أن المجيبين قد ينحازون إلى الظهور مظهر متسق مع مرور الوقت. 
ومن المفترض أن يختار الأشخاص الذين لديهم دوافع ليكونوا متسقين نفس الاستجابة 
بعد التعرض لتدخل تجريبي كما كان الحال قبل التعرض لمثل هذا التدخل. غير أن شكل 
أو صيغة التناظر البصري يستبعد هذا الاحتمال. إذا كانت استجابات ما بعد المعالجة 
التجريبية قد خرجت بشكل gl) Cob‏ في نفس الاتجاه عادةً) عن الاستجابة السابقة قبل 
doled!‏ بالنسبة للموضوعات التجريبية وبشكل عشوائي لعناصر الضبط والتحكم, UE‏ 
اختيار مقياس تناظر بصري قد يكون ساهم في الكشف عن ظاهرة دقيقة كانت أساليب 
أخرى تخفيها. 

غالبًا ما تستخدم مقاييس التناظر البصري كمقاييس أحادية البند. وهذا له عيب كبير 
يتمثل في استبعاد أي تحديد للاتساق الداخلي. ومع المقياس أحادي البندء فإنه لا مكن 
تحديد GLY!‏ إلا من خلال استخدام طريقة dole!‏ الاختبار test-retest‏ الموضحة في الفصل 
الثالث أو با مقارنة مع مقاييس أخرى لنفس السمة التي لها خصائص سيكومترية راسخة. 
وتعاني الطريقة الأولى من مشكلات تقييمات Sole]‏ الاختبار التي تمت مناقشتها سابقًاء ولا 
سيما استحالة التمييز بين عدم الاستقرار في عملية القياس وعدم استقرار الظاهرة التي 
يتم قياسها. Lol‏ الطريقة الأخيرة فهي في الواقع تقابل (تشبه) صدق المفهوم البنائي. ومع 
SLU! OY HAS LS‏ شرط ضروري للصدق» يمكن للمرء أن يستنتج الثبات إذا كان هناك 
دليل على الصدق. ومع US‏ قد تكون الإستراتيجية الأفضل هي تطوير عدة بنود تناظرية 
بصرية بحيث يمكن تحديد الاتساق الداخلي. 


أشكال الاستجابة العددية والعمليات العصبية الأساسية: 

تشير دراسة yo‏ تها «زورزي وبرفيتليس وأوميليتا» Zorzi, Priftis, and Umilita‏ 
)2002( شرت في مجلة الطبيعة Nature‏ إلى أن بعض خيارات الاستجابة قد تتوافق مع 
كيفية معالجة الدماغ للمعلومات الرقمية أو العددية. وفقاً لما ذكره هؤلاء المؤلفونء 
فإن الأرقام المرتبة في تسلسلء كما هو الحال مع مقياس ”ليكرت“ النموذجيء تعبر عن 
الكمية ليس فقط في قيمها الرقمية أو العددية ولكن في مواقعها. ويقترح هؤلاء المؤلفون 
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أن الخط البصري للأرقام ليس مجرد تمثيل مناسب بل إنه يتوافق مع العمليات العصبية 
الأساسية. ولاحظوا أن الأشخاص الذين يعانون من إصابات مختلفة في الدماغ والتي تؤثر 
على الإدراك ا مكاني في المجال البصري يقومون بارتكاب elas}‏ منهجية في مسائل الرياضيات 
البسيطة التي يتم تقدهها بصرياً (أو بصورة مرئية). ويرتبط الشذوذ ”الانحراف“ المكاني 
ونوع الأخطاء ارتباطاً وثيقاً. فالأفراد الذين مم يتمكنوا من إدراك led!‏ البصري أو ا مرق 
الأيسرء عندما Cub‏ منهم الإشارة إلى نقطة الوسط أو Garth)‏ بين قيمتين معروضتين في 
ترتيب أو مصفوفة خطية» كانوا يخطئون legs‏ ”إلى اليمين“. على سبيل JEU‏ عندما سثل 
الأفراد عن النقطة المتوسطة بين النقطتين ”7“ 99 تحولت الأخطاء إلى اليمين (أي إلى 
القيم الأعلى). وبعكس المقياس من القيم الأعلى إلى القيم الأدنى استمر في إحداث تحولات 
إلى اليمين (الآنء القيم الأدنى). وعندما تم تقديم نفس المهام في شكل غير مرثئي (على 
سبيل Ub!‏ من خلال طرح السؤال عن متوسط b .)39 Y‏ يظهر النمط. والواقع» لم يظهر 
هؤلاء الأفراد أي عجز في أداء الحسابات عندما لم يتم عرضها بصرياً. لم يظهر الأشخاص 
الخاضعين للضبط دون وجود الشذوذ أو الانحراف البصري نمط التحول لدى الذين يعانون 
من إصابات أو SUT‏ الدماغ. ويخلص المؤلفون إلى أن عملهم يشكل So»‏ قوياً على أن 
خط الأرقام الذهنية هو أكثر من مجرد تعبير مجازي أو تشبيه وأن «التفكير في الأرقام من 
الناحية المكانية (كما ذكر علماء الرياضيات العظماء) قد يكون أكثر كفاءة لأنه يقوم على 
أساس التمثيل العصبي الفعلي للأرقام» (ص (YA‏ وعلى الرغم من أن هذه الدراسةء في 
حد ذاتهاء قد لا تبرر استنتاجات قاطعة وسريعة» إلا أنها توفر أدلة أولية جديرة بالاهتمام 
على أن تقييم سلسلة خطية من الأرقام قد تتوافق مع الآليات العصبية الأساسية المتضمنة 
في التقييم الكمي. وإذا كان هذا هو الحال بالفعلء فإن خيارات الاستجابة المعروضة كصف 
من الأرقام قد تكون لها ميزة خاصة. 


الخيارات الثنائية: 


يوفر شكل وصيغة استجابة شائع آخر للأشخاص فرصة الاختيار بين الخيارات الثنائية لكل 
بند. وكانت الأمثلة السابقة لمقياس «ثرستون» Thurstone‏ ومقياس ”جتمان“ Guttman‏ 


22 Hous 


تستخدم الخيارات الثنائية (”موافق“ و”غير (“Bilge‏ على الرغم من أن المقاييس التي 
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تحتوي على البنود متساوية الوزن قد تشتمل أيضاً على خيارات استجابة ثنائية. على سبيل 
المثال» قد يُطلب من الأشخاص التأشير على جميع الصفات الموجودة في LEB‏ يعتقدون أنها 
تنطبق على أنفسهم. أو قد يُطلب egio‏ الإجابة ب ”نعم“ أو ”لا“ على قائمة ردود الفعل 
العاطفية التي قد تكون لديهم في بعض المواقف المحددة. وف LIS‏ الحالتين» هكن جمع 
أو دمج الاستجابات التي تعكس بنود تشترك في متغير كامن مشترك (على سبيل JELI‏ 
الصفات مثل ”حزين“ و”غير سعيد“ و”الأزرق“ والتي تمثل الاكتئاب) في درجة واحدة لهذا 
المفهوم البنائي. 

ويتمثل أحد أوجه القصور الرئيسية في الاستجابات الثنائية في أن كل بند لا يمكن أن 
يكون له سوى أقل قدر من التباين (القابلية للتغير). وبالمثلء فإن أي زوج من البنود هكن 
أن يكون له مستوى واحد فقط من مستويين من التغاير (التباين المشترك): الاتفاق أو عدم 
الاتنفاق. تذكر من الفصل الثالث أن تباين المقياس الذي يتكون من عدة بنود متساوية 
الوزن أو الترجيح يساوي تماماً مجموع كافة العناصر في مصفوفة التغاير لكل بند على حدة. 
وفي dle‏ البنود ثنائية الاستجابةء فإن كل بند يساهم بقدر ضئيل في هذا ا مجموع بسبب 
القيود في التباينات والتغايرات (التباينات المشتركة) المحتملة. والنتيجة العملية لذلك هي 
وجود حاجة إلى المزيد من البنود للحصول على نفس درجة تباين المقياس إذا كانت البنود 
ثنائية الاستجابة. ومع Bole US‏ ما تكون الإجابة على البنود ثنائية الاستجابة سهلة 
للغاية. UUs‏ فإن العبء الملقى على عاتق الشخص يكون منخفضاً بالنسبة لأي بند من 
البنود. على سبيل Jb!‏ هكن لمعظم الناس أن يقرروا بسرعة ما إذا كانت بعض الصفات 
هي أوصاف مناسبة لأنفسهم. ونتيجة le WE GUL‏ يكون الأشخاص على استعداد لإكمال 
المزيد من البنود ثنائية الاستجابة أكثر من تلك البنود التي تستخدم شكل أو صيغة تتطلب 
التركيز على الفروق الدقيقة. وبالتالي» فإن الشكل ثنائي الاستجابة قد يسمح للباحث 
بتحقيق تباين كاف في درجات المقياس عن طريق تجميع المعلومات على المزيد من البنود. 


الأطر الزمنية للبند: 


A‏ مث مشكلة أخرى تتعلق بشكل وتنسيق البنود تتمثا في الإطار الزمني ا محدد أو الخ لضمني. 
يناقش AS‏ ومكجراث )1988( Kelly and McGrath‏ في مجلد آخر من هذه السلسلة 
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أهمية النظر والأخذ في الاعتبار السمات الزمنية للمقاييس المختلفة. ولن تشير بعض 
المقاييس إلى إطار زمني» مما يعني وجود منظور زمني عالمي. على سبيل المثال» كثيراً 
ما تتضمن مقاييس موضع التحكم والسيطرة. على بنود تنطوي على إيمان دائم بالعلاقات 
السببية. وتفترض بعض البنود مثل «إذا اتخذت الإجراءات الصحيحة» فبوسعي أن أبقى في 
صحة جيدة» (والستون وآخرون 1978 (Wallston et al.,‏ أن هذا الاعتقاد مستقر Grud‏ 
ويتوافق هذا مع التوصيف النظري لموضع التحكم والسيطرة باعتباره متوسطاً Gle‏ وليس 
محددًا لضبط النتائج (على الرغم من حدوث تحول نحو مزيد من الخصوصية والتحديد في 
مقاييس لاحقة لموضع معتقدات التحكم - مثل ديفاليس 39,519« 1985 (DeVellis et al.,‏ 
وهناك مقاييس أخرى لتقييم الظواهر المؤقتة (العابرة) نسبياً فالاكتئاب» على سبيل 
JL!‏ هكن أن يختلف بممرور الوقت» وقد أقرت المقاييس التي تقيسه بهذه النقطة pile)‏ 
(Mayer, 1978‏ على سبيل JELI‏ يستخدم مقياس الاكتئاب الخاص مركز الدراسات الوبائية 
(رادلوف 1977 (Radloff,‏ الذي يستخدم على نطاق واسع تنسيقاً يطلب من المستجيبين 
الإشارة إلى عدد المرات التي عانوا فيها حالات مزاجية مختلفة خلال الأسبوع الماضي. وبعض 
«lit!‏ مثل مقاييس القلق )1970 (e.g., Spielberger, Gorsuch, & Lushene,‏ 
تم تطويرها بأشكال مختلفة وتهدف إلى تقييم الحالات العابرة (المؤقتة) نسبياً أو السمات 
الدائمة نسبياً )1983 (Zuckerman,‏ 


وينبغي على الباحث أن يختار إطاراً زمنياً لمقياس نشط (إيجابي) وليس بشكل سلبي. 
وعد النظرية بمثابة دليل مهم لهذه العملية. هل تشكل الظاهرة موضع الاهتمام جانباً 
أساسياً Lélog‏ لشخصيات الأفرادء أم أنها من المرجح أن تعتمد على الظروف المتغيرة؟ هل 
المقصود من المقياس هو الكشف عن الاختلافات الدقيقة التي تحدث خلال فترة زمنية 
قصيرة (على سبيل JELI‏ زيادة التأثير السلبي بعد مشاهدة فيلم حزين) أو التغييرات التي 
قد تتطور على مدى العمر (على سبيل SEL!‏ السياسات المحافظة المتصاعدة مع زيادة 
السن)؟ 

Gs‏ الختام» ينبغي أن تعكس أشكال وتنسيقات le ogil‏ في ذلك خيارات الاستجابة 
والتعليمات» طبيعة المتغير الكامن محل الاهتمام والاستخدامات المستهدفة للمقياس. 
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الخطوة الرابعة: مراجعة تجمع البنود الأولية من قبل الخبراء: 

حتى OMI‏ ناقشنا الحاجة إلى تحديد وتوضيح الظاهرة محل الاهتمام تحديداً واضحاً 
وتوليد وتكوين مجموعة من البنود المناسبة» واختيار شكل الاستجابة أو الردود لتلك البنود. 
الخطوة التالية في هذه العملية هي قيام مجموعة من الأشخاص الذين لديهم دراية ومعرفة 
في مجال المحتوى بمراجعة تجمع البنود. وتحقق هذه المراجعة أغراضاً متعددة تتعلق 
بتعظيم صلاحية المحتوى للمقياس (انظر الفصل الرابع). 

Vol‏ قد تؤدي مراجعة الخبراء لتجمع البنود الخاص بك إلى تأكيد أو إبطال التعريف 
الخاص بالظاهرة. ويمكنك أن تطلب من فريق الخبراء le)‏ سبيل JELI‏ الزملاء الذين 
عملوا بشكل مكثف ومستفيض مع المفهوم GL!‏ محل البحث أو الظواهر ذات الصلة) 
تقييم مدى ارتباط وأهمية كل بند من البنود Le‏ تنوي قياسه. ويكون هذا مفيداً بشكل 
خاص إذا كنت تقوم بتطوير مقياس يتكون من مقاييس منفصلة لقياس مفاهيم بنائية 
متعددة. إذا كانت لديك عناية كبيرة عند وضعك وتطويرك GIS ogl‏ الخبراء لن يجدوا 
صعوبة كبيرة في تحديد البنود التي تتوافق مع المفاهيم البنائية. في الأساسء» فإن أفكارك 
حول ما يقيسه كل بند تمثل الفرضية. وردود وإجابات الخبراء هي البيانات التي تؤكد 
أو تنفي الفرضية (بمعنى إنها تمثل اختبار هذه الفرضية). حتى إذا كان الغرض من كافة 
البنود مخصصاً لقياس daw‏ واحدة أو مفهوم oly Gly‏ فإن مراجعة الخبراء تكون مفيدة. 
إذا قرأ الخبراء شيئاً ما في بند لم تكن تنوي لإدراجه وتضمينه» فقد يفعل الأشخاص الذين 
يكملون مقياساً نهائياً نفس الشيء. 

bole‏ ما تتضمن GWT‏ الحصول على تقييمات Glad‏ بصلة البند على تزويد فريق 
الخبراء بتعريفك العملي للمفهوم البنائي» ثم يُطلب منهم تقييم كل بند من Cur‏ أهميته 
وصلته بالنسبة للمفهوم البنائي كما قمت بتحديده وتعريفة. وقد يستلزم هذا الأمر مجرد 
تصنيف أهمية أو صلة كل بند على أنها Ale‏ أو متوسطة أو منخفضة. بالإضافة إلى ذلك 
قد تدعو الخبراء إلى التعليق على البنود كل على حدة على النحو الذي يرونه Luulie‏ وهذا 
يجعل عملهم أكثر صعوبة إلى to‏ ماء ولكنه يمكن أن يوفر معلومات ممتازة. وقد تمنحك 
بعض التعليقات الثاقبة أو Spach!‏ حول سبب غموض بعض ogil‏ على سبيل JLI‏ 
منظوراً جديداً عن LAS‏ محاولة قياس مفهومك البنائي. 
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كما يمكن للمراجعين أيضاً تقييم وضوح البنود ومدى إيجازها ودقتها. قد يكون محتوى 
أحد البنود ذا صلة بالمفهوم البنائيء ولكن صياغته قد تكون فيها إشكالية. وهذا يؤثر على 
OLS‏ البندء لأن وجود بند غامض أو غير واضح» بدرجة أكبر من بند واضح» يمكن أن يعكس 
عوامل خارجة عن المتغير الكامن. في التعليمات الخاصة التي تقدمها إلى ا مراجعينء اطلب 
منهم الإشارة إلى البنود غير الملائمة أو المربكة واقتراح صيغ بديلة لهاء إذا كانوا يميلون إلى ذلك. 

وتتمثل الخدمة الثالثة التي يمكن أن يقدمها خبراء المراجعة في الإشارة إلى طرق الاستفادة 
من الظاهرة التي فشلت في إدراجها. قد تكون هناك مقاربة كاملة قد أغفلتها وتجاهلتها. 
على سبيل JEL‏ رها تكون قد قمت بإدراج العديد من البنود التي تشر إلى امرض في 
مجموعة من agil‏ المعنية با لمعتقدات الصحية ولكنها لم تعتبر الجروح أو الإصابات ilig‏ 
انحرافٍ آخر gò‏ صلة عن الصحة. من خلال مراجعة الطرق المتنوعة التي قمت بها 
لتجسيد والتعبير بها عن الظاهرة موضع الاهتمام: يمكن أن يساعدك ال مراجعون في زيادة 
صلاحية المحتوى للمقياس الخاص بك إلى أقصى حد. 


كلمة تحذير أخيرة بشأن رأي الخبراء: إن القرار النهائي بقبول نصيحة الخبراء أو رفضها 
هو مسؤوليتك كمطور للمقياس. وفي بعض الأحيان» قد لا يفهم خبراء المحتوى مبادئ بناء 
المقياس» وقد يؤدي هذا إلى نصيحة سيئة. ومن التوصيات التي واجهها كثيرٌ من الزملاء 
الذين لا يتمتعون بخبرة كبيرة في مجال تطوير المقياس هي التخلص من البنود التي تتعلق 
بنفس الشيء. وكما سبقت مناقشته» فإن حذف جميع حالات التكرار من تجمع البنود 
أو المقياس النهاي سيكون ths‏ فادحاً لأن التكرار هو جزء لا يتجزأ من الاتساق الداخلي. 
ومع ذلك» قد يشير هذا التعليق إلى أن صياغة البنود» ومفرداتها وتركيبها اللغوي متشابهة 
للغاية ويمكن تحسينها. انتبه جيدًا لكل الاقتراحات التي تتلقاها من خبراء المحتوى, ثم 
اتخذ قرارك عن علم وبصيرة حول كيفية استخدام نصائحهم. 

وفي هذه المرحلة من العمليةء يكون لدى مطور المقياس مجموعة من البنود التي 
تمت مراجعتها من قبل الخبراء وتعديلها Lids‏ لذلك. وقد حان الوقت الآن للتقدم إلى 
الخطوة التالية. 
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قواعد إرشادية في تطوير المقياس 


الخطوة الخامسة: النظر في إدراج وتضمين البنود التي تحقق الصدق: 

من الواضح أن جوهر استبيان تطوير المقياس هو مجموعة البنود التي سينبثق منها 
المقياس قيد التطوير. وعلى ii‏ حالء فإن pal‏ وبعض الحكمة يمكن أن توت مارها 
بشكل رائع. وقد يكون من الممكن والملائم نسبياً ghol‏ وتضمين بعض البنود الإضافية في 
الاستبيان نفسه التي ستساعد في تحديد صدق المقياس النهائي. هناك نوعان على الأقل من 
البنود التي ينبغي مراعاتها وأخذها في الاعتبار. 

النوع الأول من البنود الذي قد يختار مطور المقياس إدراجه وتضمينه في استبيان يعمل 
أو يساعد على اكتشاف العيوب أو المشكلات. قد لا يجيب المستجيبون على البنود IS‏ 
الأهمية الأساسية للأسباب التي تفترضهاء وقد تكون هناك دوافع أخرى تؤثر على استجاباتهم 
وردودهم. إن العلم بذلك ومعرفته في وقت مبكر يُعد أمراً مفيداً. ومن بين أنواع الدوافع 
التي يمكن تقييمها بسهولة إلى حد ما هو المرغوبية الاجتماعية social desirability‏ 
وإذا كان الفرد متحمساً بقوة لتقديم نفسه أو نفسها بطريقة يعتبرها المجتمع إيجابية, 
فقد تكون الاستجابات على البنود مشوهة أو محرفة. ويسمح تضمين مقياس المرغوبية 
الاجتماعية للباحث بتقييم مدى تأثر كل بند من البنود على حدة بشدة بالمرغوبية 
الاجتماعية. وينبغي اعتبار البنود التي ترتبط ارتباطاً كبيراً بدرجة المرغوبية الاجتماعية التي 
يتم الحصول عليها مرشحة للاستبعاد ما مم يكن هناك سبب نظري سليم يشير إلى خلاف 
US‏ وقد تم وضع وتطوير مقياس موجز ومفيدٍ للمرغوبية الاجتماعية من قبل ”ستراهان 
وجيرباسي“ )1972( Strahan and Gerbasi‏ ويمكن إدراج هذا المقياس المكون من عشرة 
بنود بشكل ملائم في استبيان. 

وهناك مصادر أخرى لبنود الكشف عن اتجاهات الاستجابة غير المرغوب فيها ”أناستاسي“ 
.(Anastasi, 1968)‏ يتضمن اختبار مينيسوتا المتعدد الأوجه للشخصية The Minnesota‏ 
Multiphasic Personality Inventory‏ رهاثاواي Hathaway & McKinley, «lil‏ 
globle 11967‏ وميهلء 1951 (Hathaway & Meehl,‏ العديد من المقاييس التي تهدف 
إلى الكشف عن أوجه التحيز المختلفة في الاستجابة. وفي بعض الحالات» قد يكون من 
امناسب elo!‏ هذه الأنواع من المقاييس. 
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أما الفئة الأخرى من البنود التي ينبغي أخذها في الاعتبار لإدراجها في هذه المرحلة 
فهي تتعلق بصدق المفهوم البنائي للمقياس. ووفقاً Ub‏ تمت مناقشته في الفصل الرابع؛ IS}‏ 
كانت النظرية تؤكد أن الظاهرة التي تقوم بقياسها ترتبط بمفاهيم بنائية أخرىء فإن أداء 
المقياس في مقابل مقاييس تلك المفاهيم البنائية الأخرى يمكن أن يكون دليلاً على صدقه. 
وبدلاً من UL‏ جهد منفصل للتحقق من الصدق بعد تكوين المقياس النهائي» قد يكون من 
الممكن إدراج مقاييس المفاهيم البنائية ذات الصلة في هذه Ale yb!‏ ويمكن أن يوفر مط 
العلاقات الناتجة دعماً للادعاءات المتعلقة بالصدق أو بدلاً من ذلكء يقدم أدلة إذا م يكن 
أداء مجموعة البنود كما كان متوقعاً. 


الخطوة السادسة: تطبيق البنود على عينة تطوير المقياس: 

بعد تحديد البنود ال مرتبطة بالمفهوم البنائي والصدق التي يجب تضمينها وإدراجها في 
الاستبانة الخاصة wh‏ يجب عليك تطبيقهاء Lue‏ إلى جنب مع مجموعة البنود الجديدة 
على بعض الأشخاص. يجب أن تكون عينة الأشخاص كبيرة. كم يبلغ حجمها الكبير؟ من 
الصعب التوصل إلى توافق في الآراء بشأن هذه المسألة. دعونا ندرس الأساس المنطقي 
لعينة كبيرة. ويشير «نونالي» )1978( Nunnally‏ إلى أن مسألة أخذ العينات الأوّلية في 
تطوير المقياس تنطوي على أخذ عينات من البنود من ble‏ افتراضي (راجع غيسيليء كامبلء 
وزيديكء 1981 .(Ghiselli, Campbell, & Zedeck,‏ ومن أجل التركيز على مدى ALS‏ 
البنود» ينبغي أن تكون العينة كبيرة Le‏ فيه الكفاية للقضاء على تباين الأشخاص باعتباره 
مصدر قلق كبير. ويشير «Nunnally Jbg»‏ إلى أن ٠١‏ شخص هم عدد SIS‏ ومع US‏ 
فإن التجربة العملية تشير إلى أن المقاييس قد تم وضعها وتطويرها بنجاح باستخدام عينات 
أصغر حجماً. كما أن ous‏ البنود وعدد المقايبس التي سيتم استخراجها واستخلاصها له تأثير 
أيضاً على مسألة حجم العينة. وإذا كان الهدف استخراج مقياس واحد فقط من مجموعة 
تضم حوالي dus ٠١‏ فإن dus‏ حجمها أقل من ٠٠١‏ شخص قد تكون كافية. 

هناك العديد من المخاطر في استخدام ous‏ قليل جداً من الأشخاص. Vol‏ قد لا تكون 
أأماط التغاير بين البنود مستقراً. قد يتحول بند ما يبدو أنه يزيد من الاتساق الداخلي 
إلى أن يكون عديم القيمة عند استخدامه في عينة منفصلة. إذا تم اختيار البنود لإدراجها 
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(كما هي بشكل جيد للغاية) على أساس مساهمتها في معامل OB “WI”‏ وجود äus‏ 
تطويرية صغيرة يمكن أن ترسم صورة وردية غير دقيقة للاتساق الداخلي. وعندما تكون 
نسبة الأشخاص إلى البنود منخفضة نسبياً وحجم العينة غير كبيرء هكن أن تتأثر الارتباطات 
المتبادلة بين البنود بالصدفة chance‏ بدرجة كبيرة إلى s>‏ ما. وعندما تتم Sole]‏ إدارة 
(تطبيق) المقياس الذي تم اختيار بنوده في JB‏ هذه الظروف» فإن العوامل المحتملة التي 
جعلت بعض البنود تبدو جيدة في البداية لم تعد صالحة. وبالتالي» OB‏ معامل ”ألفا“ الذي 
يتم الحصول عليه في مناسبات «دراسات» أخرى غير دراسة التطوير الأوّلية للمقياس قد 
تكون أقل من المتوقع. وعلى نحو Sloe‏ قد يتم استبعاد أي بند من المحتمل أن يكون 
جيداً لأن ارتباطه ببنود أخرى كانت منخفضة بمحض الصدفة البحتة. 

ونمة مشكلة ثانية محتملة لحجم العينة الصغير هي أن dus‏ التطوير قد BEY‏ 
امجتمع الإحصائي الذي يستهدفه المقياس. وبطبيعة الحالء قد يكون هذا هو الحال أيضاً 
إذا كانت عينة التطوير SyS‏ ولكن من المرجح أن تستبعد عينة صغيرة أنواعًا معينة 
من الأفراد. وبالتالي» يجب على مطور المقياس أن يأخذ في الاعتبار WS‏ من حجم وتكوين 
عينة التطوير. قد يختار الباحث الدقيق معالجة إمكانية أو قابلية تعميم المقياس عبر 
المجتمعات الإحصائية (أو بعض الجوانب facet‏ الأخرى) باستخدام دراسة إمكانية التعميم 
G-study‏ على النحو الذي تم توضيحه في الفصل الثالث. 

ليست كل أنواع عدم تمثيل ال مجتمع متطابقة. هناك على الأقل طريقتان مختلفتان قد 
لا تمثل العينة من خلالهما المجتمع الإحصائي الأكبر. الأولى تتضمن مستوى السمة الموجودة 
في العينة مقابل مستواها ف المجتمع الإحصائي المستهدف. فعلى سبيل اممثالء قد تمثل 
العينة نطاقًا أضيق من السمة عما كان متوقعاً في المجتمع الإحصائي. قد يكون هذا التضييق 
في النطاق غير متماثل أيضًا بحيث يكون متوسط الدرجات التي يتم الحصول عليها على 
مقياس العينة أعلى أو أقل بكثير مما يتوقعه الفرد بالنسبة للمجتمع Glas‏ قد تختلف 
الآراء المتعلقة بالعمر القانوني الملائم لشرب الخمر في حرم الجامعة» على سبيل JGL‏ عن 
الآراء المتعلقة بالموضوع نفسه في المجتمع المحلي ككل. ولا تعني القيمة المتوسطة للسمة 
التي لا تكون ممثلة للمجتمع بالضرورة عدم أهلية العينة لأغراض تطوير المقياس. وقد 
يؤدي ذلك إلى توقعات غير دقيقة بشأن متوسطات المقياس في حين أنها لا تزال تقدم صورة 
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دقيقة عن ثبات الاتساق الداخلي الذي يتمتع به المقياس. فعلى سبيل JEL‏ قد تؤدي 
عينة من هذا النوع إلى استنتاجات صحيحة حول البنود الأكثر ارتباطًا مع بعضها البعض. 


وهناك نوع أكثر إزعاجاً من عدم تمثيل العينة للمجتمع ينطوي على عينة تختلف Kegs‏ 
وليس كمياً عن المجتمع الإحصائي المستهدف. على وجه التحديدء فإن العينة التي قد 
تختلف فيها العلاقات بين البنود أو المفاهيم البنائية عن المجتمع الإحصائي هي سبب يدعو 
للقلق. إذا كانت العينة غير معتادة أو استثنائية LAL‏ فقد يكون للبنود معنى مختلف 
بالنسبة لهم عن معناها بالنسبة للأشخاص بشكل ale‏ قد تعكس أماط الارتباط بين 
البنود سمات غير عادية مشتركة بين أفراد العينة ولكنها نادرة الوجود في المجتمع الأوسع. 
وبعبارة ]5 5« قد تكون مجموعات البنود المترابطة التي تنشأ (من التحليل العامليء مثلاً) 
غير نمطية أو غير مألوفة. إذا تم ذكر ذلك بشكل رسمي بعض ce gid!‏ فقد يكون الهيكل 
أو البناء السببي الأساسي الذي يربط المتغيرات بالدرجات الحقيقية مختلفًا إذا كانت العينة 
تختلف عن المجتمع الإحصائي من نواح هامة. ولنتأمل هنا بعض الأمثلة الواضحة إلى حد 
ما: إذا م يفهم أعضاء العينة المختارة كلمة رئيسية تتكرر بين البنود وذات صلة بالمفهوم 
البنائي» فإن استجاباتهم عليها Ley‏ تخبرنا بالقليل أو لا تخبرنا بأي شيء حول كيفية أداء 
المقياس في ظل ظروف مختلفة. فكلمة مريض “Sick”‏ تعني ”مريض “ill‏ في الولايات 
المتحدة. ولكنها تعني ”الشعور بالغثيان “nauseated‏ (أي الشعور بمرض في ال معدة) في 
إنجلترا. قد يكون لمجموعة من الأسئلة حول امرض illness‏ التي تم تطويرها ïe gaah‏ 
ما معنى مختلف بشكل ملحوظ بالنسبة للمجموعة الأخرى. إذا كان المقياس يتعلق 
Uig‏ صحية معينة لا ترتبط dole‏ بالغثيان (مثل التهاب المفاصل). فقد تتجمع البنود 
التي تستخدم كلمة ”مريض “ill‏ معًا بسبب معناها المميز إذا كانت العينة بريطانية. ومن 
ناحية أخرىء فإن العينة من الولايات المتحدة الأمريكية من غير ال محتمل أن تميز أو تفرق 
بين العبارات المتعلقة بالمرض وغيره من البنود GIS‏ الصلة بالصحة. حتى داخل الولايات 
ا متحدة الأمريكية: يمكن أن تكون لنفس الكلمة معان مختلفة. فبين سكان الجنوب في 
dads Il g BL‏ ها سل a GIB SLAM‏ الما كد عفدم ALS Cll‏ عن 
الأمراض التناسلية ”مرض الزهري"» بينما يعني العداء في أجزاء أخرى من البلاد. وإذا كان 
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هناك بند يناقش ”الدم الفاسد بين الأقارب“ وكان أداؤه مختلفاً بين dus‏ من Lal‏ الجنوب 
في المناطق الريفية مقابل عينات أخرىء» فإن هذا لن يكون بالأمر المفاجئ أو المستغرب. 

يمكن أن تؤدي عواقب هذا النوع الثاني من عدم تمثيل العينة للمجتمع إلى إلحاق ضرر 
بالغ بجهود تطوير المقياس. قد تكون البنية الأساسية التي تنشأ - وهي أنماط التغاير 
بين البنود المهمة للغاية لقضايا OLS‏ المقياس - بمثابة اختلاف من العينة اللمستخدمة في 
التطوير. إذا كان لدى الباحث سبب للاعتقاد بأن المعنى المنسوب للبنود قد يكون غير 
شائع أو غير نمطي بين عينة التطويرء فينبغي توخي الحذر الشديد في تفسير النتائج التي 
يتم الحصول عليها من تلك العينة. 


الخطوة السابعة: تقييم البنود: 

وبعد تطوير المجموعة الأولية من البنود وتدقيق هذه البنود (تطبيقها) على dine‏ كبيرة 
وممثلة بشكل مناسب» فقد حان الوقت لتقييم slo}‏ كل بند على حدة بحيث يمكن تحديد 
البنود المناسبة التي تشكل أو تكون المقياس. وهذاء من جوانب عديدةء هو جوهر أو 
أساس عملية تطوير المقياس. ورها GL‏ تقييم البند في المرتبة الثانية فيما يتعلق بتطوير 
البنود من حيث أهميته فقط. 


الفحص المبدئي لأداء البنود: 

عند مناقشة تطوير البندء أشرنا إلى بعض الصفات المرغوب فيها التي ينبغي أن تكون في 
بنود المقياس. دعونا نعيد النظر في هذه القضية أو المسألة. إن الجودة النهائية التي نسعى 
إلى وجودها في أي بند هي أن يكون ارتباطه Jle‏ مع الدرجة الحقيقية للمتغير الكامن. 
Gbg‏ هذا مباشرةً من مناقشة OLII‏ في الفصل الثالث. ولا يممكننا أن نقيم الدرجة الحقيقية 
بشكل مباشر (إذا استطعنا القيام Ui‏ فرها لن نحتاج إلى مقياس)ء وبالتالي» لا يمكننا 
أن نحسب ارتباطها ا متبادل مع البنود بشكل مباشر. ومع EUS‏ يمكننا إجراء استدلالات 
بناءَ على نماذج القياس الرسمية التي تمت مناقشتها حتى الآن. عند مناقشة الاختبارات 
المتكافئة في الفصل GW‏ أشرت إلى أن الارتباط بين أي بندين يساوي مربع الارتباط بين أي 
بند من البندين والدرجة الحقيقية. هذه القيمة التربيعية هي ثبات كل بند من البنود. 
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لذلك؛ يمكننا التعرف على العلاقات مع الدرجات الحقيقية من خلال الارتباطات Polak!‏ 
بين البنود. وكلما كانت الارتباطات بين البنود مرتفعة» كان ثبات كل بند من البنود على 
حدة مرتفعاً (أي» كلما كانت البنود مرتبطة ارتباطاً وثيقاً بالدرجة الحقيقية). وكلما كان 
كل بند من البنود على حدة GLI JST‏ كان المقياس الذي يؤلفونه As) BLS AST‏ افتراض 
أنها تشترك في متغير كامن مشترك). لذلك؛ فإن أول صفة للجودة نسعى إليها في مجموعة 
من بنود المقياس هي أنها تكون مترابطة ترابطا قوياً. وإحدى الطرق لتحديد كيفية أو مدى 
الارتباط المتبادل بين البنود تتمثل في فحص مصفوفة الارتباط. 


عكس تسجيل الدرجات: 

إذا كانت هناك بنود ارتباطها ارتباط سلبي مع بنود أخرىء فينبغي عندئذ النظر في 
مدى مناسبة إجراء تسجيل درجات تلك البنود في صورة عكسية (أي التصحيح العكسي 
لتلك البنود). وف وقت سابقء اقترحت أن البنود التي صيغت في اتجاهات متعاكسة يمكن 
أن تثير مشاكل. ولكن في بعض الأحيانء قد ينتهي بنا الأمر دون قصد إلى بنود مرتبطة 
مع بعضها البعض ارتباطاً سلبياً. وقد يحدث هذا sie‏ سبيل JELI‏ إذا توقعنا في البداية 
مجموعتين منفصلتين من البنود (تتعلق بالسعادة والحزن» على سبيل (SEL!‏ ولكننا قررنا 
لسبب ما أن يتم دمجهما في مجموعة واحدة. ويمكننا بعد ذلك أن ينتهي بنا الأمر إلى 
عبارات ترتبط بشكل متساو بالمفهوم البنائي المركب الجديد (على سبيل JEL‏ التأثير)» 
ولكن بعضها قد يكون إيجابياً وبعضها الآخر سلبياً. «أنا سعيد» و«أنا حزين» كلاهما 
يتعلق على حد سواء بالتأثير؛ ومع US‏ فهما متضادان. إذا أردنا الحصول على درجات 
عالية على مقياسنا لقياس السعادةء فسيتعين علينا أن نعطي قيمة عالية لتأييد أو اموافقة 
على البند «سعيد» وإعطاء قيمة منخفضة sold‏ البند «حزين». liag‏ يعني» أننا سنعكس 
تسجيل درجة بند الحزن. وفي بعض الأحيان» تتم إدارة أو تطبيق البنود بطريقة تكون 
معكوسة بالفعل. فعلى سبيل SLB‏ قد يطلب من الأشخاص وضع دائرة حول قيم رقمية 
أعلى لبيان الاتفاق مع بند «سعيد» وقيم أقل للإشارة إلى تأييد بند «حزين». ومن بين 
الطرق للقيام بذلك أن تكون التوصيفات اللفظية لخيارات الاستجابة (على سبيل Jb‏ 
Y»‏ أوافق بشدة». Y»‏ أوافق إلى حد cule‏ وما إلى ذلك) Lalo‏ بالترتيب نفسه لكل البنود 
ولكن مع ربط الأرقام بها إما تصاعدياً أو تنازليةً اعتماداً على البند: 
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-١‏ أشعر بالحزن في كثير من الأحيان. 


E ee ee‏ ا el‏ ا 
غير موافق | غير موافق إلى | غير موافق |موافق بشكل| موافق إلى أموافق بشدة 
oe‏ | مه امم تسر 


È -Y‏ كثير من الأوقات» أكون سعيداً. 


E E LE |‏ ات a‏ 
غير موافق | غير موافق إلى | غير موافق |موافق بشكل| موافق إلى أموافق بشدة 
ee |‏ امد سه 


وقد تتسبب هذه العملية في إرباك الشخص المجيب. فقد يتجاهل الناس الكلمات 
بعد أن يدركوا أنها هي واحدة لكل البنود. ومع ذلك رها يكون من الأفضل تغيير ترتيب 
التوصيفات (على سبيل SUB!‏ من “غير موافق بشدة“ إلى ”موافق بشدة“ من اليسار إلى 
اليمين بالنسبة لبعض البنود وعكس اتجاه البنود الأخرى). وثمة خيار آخر يتمثل في أن 
تكون كل من الأوصاف اللفظية والأرقام المناظرة هي نفسها بالنسبة لكل البنود. ولكن يتم 
إدخال قيم مختلفة لبنود معينة عند ترميز البيانات. إن تغيير الدرجات لبنود معينة عند 
الترميز يكون أمراً مملاً ومن المحتمل أن يكون عرضة للأخطاء على حد سواء. لكل شخصء 
يجب أن يُعطّى كل بند يتم تسجيل درجته بطريقة عكسية. الاهتمام الخاص الذي ينطوي 
عليه تسجيل الدرجات العكسيةء وهذا من شأنه أن يخلق العديد من الفرص للأخطاء. 


وأسهل طريقة لتسجيل الدرجات العكسية هي القيام بذلك Bg SU)‏ مجرد إدخال 
البيانات إلى جهاز الحاسب الآلي. تستطيع بعض بيانات الحاسب JYI‏ التعامل مع BE‏ 
الدرجات العكسية لبيانات كل الأشخاص. إذا كانت خيارات الاستجابة تحتوي على قيم 
رقمية وكان التحويل المطلوب هو عكس ترتيب هذه القيم» فيمكن استخدام صيغة 
(معادلة) بسيطة. على سبيا JELI‏ افترض أنه تم تسجيل مجموعة من بنود الحالة 
المزاجية التي تمت صياغتها أو تنسيقها باستخدام مقياس «ليكرت» من القيمة )١(‏ إلى 
القيمة (V)‏ والأرقام الأعلى تشير إلى الموافقة. افترض dil EUIS‏ لتسهيل الفهم» تم استخدام 
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نفس شكل أو صيغة الاستجابة لكل من بنود الحالة ا مزاجية الإيجابية وبنود الحالة المزاجية 
السلبية. ومع LS‏ إذا تم تعيين درجات عالية في حالة الموافقة le‏ وتأييد بنود الحالة 
المزاجية الإيجابية. فإن المقياس يكون في الأماس مقياس الحالة المزاجية الإيجابية. إن 
التأييد أي الموافقة على بند الحالة المزاجية الإيجابية يجب أن يؤدي إلى قيمة Jobs dyle‏ 
بند الحالة المزاجية السلبية يجب أن يسفر عن dad‏ منخفضة. وهذا هو ما هكن الحصول 
عليه إذا تم تغيير درجات الاستجابات بالنسبة لجميع البنود المزاجية السلبية من الدرجة 
(۷) إلى الدرجة )1( وتغير الدرجة (1) إلى الدرجة (Y)‏ وهكذا دواليك. ويمكن تحقيق هذا 
النوع من التحويل عن طريق إنشاء درجة جديدة من الدرجة القدهة باستخدام الصيغة 
أو المعادلة التالية: 
NEW = (J + 1) - OLD‏ 


حيث تشير (OLD) (NEW)‏ إلى الدرجات المحولة والدرجات ELS!‏ على الترتيب» 
ويشير ([) إلى الرقم الأصلي لخيارات الاستجابة. في JEL‏ المقدم آنفاً فإن (J)‏ تساوي الرقم 
CV)‏ و(1 + (J‏ سيكون مساوياً للقيمة (A)‏ وطرح الدرجة (V)‏ من الدرجة (A)‏ سيسفر عن 
الدرجة »)١(‏ وطرح الدرجة (I)‏ سيسفر عن الدرجة (Y)‏ وهكذا. 


قدلا يمكن تصحيح بعض الارتباطات السلبية بين البنود عن طريق عكس درجات 
البنود. على سبيل JELI‏ قد يؤدي عكس درجة بند معين إلى إزالة بعض الارتباطات السلبية 
ولكنها تؤدي إلى إنشاء ارتباطات أخرىء ويشير هذا Sole‏ إلى أن بعض البنود لا تنتمي 
ببساطة لأنها لا ترتبط بشكل متسق ببنود أخرى. وينبغي التخلص من وحذف أي بند 
يرتبط إيجابياً مع بعض البنود ويرتبط سلبياً مع البعض الآخر في مجموعة متجانسة إذا لم 
يؤد أي نمط من بنود الدرجات العكسية إلى إزالة وإلغاء الارتباطات السالبة. 


ارتباطات البند بالمقياس: 


Coed يوسلوا تعض رک‎ May] ی اللو لخر‎ Lash 
أن يرتبط كل بند على حدة جوهرياً مجموعة البنود المتبقية. ويمكننا فحص هذه الخاصية‎ 
.item-scale correlation البند بالمقياس الخاص به‎ bls)! لكل بند عن طريق حساب‎ 
الها‎ Ke الح‎ E Lidl E رهاط‎ gue dLegi ET 
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corrected item-scale correlation‏ والذي يربط بين البند الذي يجري تقييمه بكل 
بنو المقياس. باستثناء البند نفس في حين أن الارتباط غير المصحح للبند بامقياس 
uncorrected item-scale correlation‏ يربط البند المعني بمجموعة البنود dois hI‏ 
بأكملهاء ها في ذلك البند نفسه. وإذا كانت هناك عشرة بنود يجري النظر فيها من أجل 
تكوين مقياسء فإن الارتباط المصحح للبند بالمقياس لأي بند من البنود العشرة سيتألف من 
ارتباط هذا البند بالبنود التسعة الأخرى. وسيتألف الارتباط غير ال مصحح للبند بالمقياس 
من ارتباط هذا البند بكل البنود العشرة. ومن الناحية dy aul‏ فإن القيمة غير المصححة 
تخبرنا عن مدى أو LAS‏ تمثيل البند في المقياس بأكمله. وهذا مشابه» على سبيل JELI‏ 
للربط بين مجموعة فرعية واحدة من اختبار الذكاء (10) وبين الاختبار بأكمله لتحديد ما 
إذا كان المقياس الفرعي وكيلاً Y el Luke proxy‏ ومع LS‏ وعلى الرغم من أن الارتباط 
الكلي غير المصحح بين البنود uncorrected item-total correlation‏ منطقي من الناحية 
المفاهيمية أو النظرية» فإن الواقع هو أن إدراج البند في المقياس من الممكن أن يؤدي إلى 
تضخم معامل الارتباط. وكلما قل عدد البنود في المجموعة. ازداد الفارق الذي سيحدثه إدراج 
أو استبعاد البند قيد الفحص والتدقيق. وبصفة Ley dale‏ يكون من المناسب أو المفضل 
فحص الارتباط المصحح بين البند ومجموع البنود „corrected item-total correlation‏ 
ويعتبر البند ذو القيمة العالية لهذا الارتباط المتبادل أكثر جاذبية (مرغوباً أكثر) من البند 
ذي القيمة ال منخفضة. 


تباينات البنود: 

هناك خاصية أخرى ذات قيمة لبند المقياس وهي التباين العالي نسبياً. لنأخذ حالة 
متطرفة» إذا قام جميع الأفراد بالإجابة على بند معين بشكل متطابق أو «Sloe‏ فلن يميز 
المقياس على الإطلاق بين الأفراد ذوي المستويات المختلفة من المفهوم البنائي الذي يتم 
قياسه وسيكون تباينه مساوياً للقيمة «صفر». وعلى النقيض من EUS‏ إذا كانت digs‏ 
تطوير المقياس متنوعة فيما يتعلق بالسمة محل الاهتمام» فينبغي أن يكون مدى الدرجات 
التي يتم الحصول عليها لأحد البنود متنوعًا أيضًا. وهذا يعني وجود تباين كبير إلى حد ما. 
وبطبيعة Jbl‏ لا يكون من ا مرغوب فيه زيادة التباين بإضافة مكون الخطأ. 
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وقد تكون مقارنة تباينات البنود مفيدة أيضًاء خاصة إذا كان الهدف هو تطوير أداة 
تلبي وتفي بافتراضات معادلة التكافؤ الأساسي J‏ «تاو» .essential tau equivalence‏ 
وعلى الرغم من أن معادلة التكافؤ الأساسي ل ”تاو“ لا تفترض وجود تباينات متساوية بين 
البنود, إلا أنها تفترض وجود تغايرات متساوية بين البنود التي لها درجة حقيقية. وبالتاليء 
عندما يتم الوفاء بافتراضات هذا النموذجء فإن الاختلافات أو الفروق في تباينات البنود 
تكون نتيجة إلى عدم الاتساق في تباينات أخطاء البنود. وكاعتبار عملي» قد يكون الفرق 
في تباينات البنود بشكل ملحوظ غير مرغوب فيهاء لأنها قد تشير Lol‏ إلى Uns jalas‏ 
مختلفة اختلاقًا G pagr‏ من بند إلى آخر أو فشل في تلبية شرط وجود تباينات مشتركة 
«تغايرات» متساوية بين البند والدرجة الحقيقة والتي يتطلبها نموذج التكافؤ الأساسي 
ل «تاو». وبطبيعة الحال» لن ينطبق هذا إذا كان النموذج التوجيهي للتطوير هو النموذج 
المتجانس congeneric model‏ والذي لا يتطلب أي شيء غير البنود التي تشترك في متغير 


كامن مشترك. 


متوسطات البنود: 

من المرغوب فيه أيضًا أن يكون المتوسط قريباً من مركز المدى للدرجات المحتملة. على 
سبيل JEL!‏ إذا كانت خيارات الاستجابة لكل بند تتراوح بين الدرجة “١7‏ (المناظرة لخيار 
الاستجابة ”لا أوافق بشدة") إلى الدرجة ”۷“ (المناظرة لخيار الاستجابة ”أوافق (rss‏ 
فإن البند الذي يكون متوسطه قريباً من الدرجة “E”‏ سيكون بنداً مثاليًا. وإذا كان المتوسط 
قريباً من أحد طرفي المدى للمقياس» فقد يفشل البند في اكتشاف قيم معينة من المفهوم 
البنائي. قد يشير تجمع أو تراكم الدرجات عند القيمة SV”‏ على سبيل المثالء إلى أن البند م 
يكن مصاغاً بقوة كافية (أي إنه من النادر أن تجد أي شخص قد لا يوافق عليه). 

Sio‏ عام» فإن البنود GIS‏ المتوسطات القريبة Me‏ من الحد الأقصى لمدى الاستجابة 
سيكون لها تباينات منخفضة؛ والبنود التي تختلف على نطاق ضيق سوف ترتبط ls)‏ 
ضعيفاً أو سيئاً بالبنود الأخرى. وكما ذكرنا سابقًاء لا هكن أن يكون البند الذي لا يتغير 
vary‏ أن يتغاير .covary‏ وبالتالي» سوف ميل المتوسط غير المتوازن أو التباين المنخفض 
لأي سبب من الأسباب إلى الحد من وتقليل ارتباط أي بند بالبنود الأخرى. ونتيجة UU‏ 
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bole LX‏ التركيز بشكل أساسي على Lg‏ الارتباطات بين البنود كمقياس لقيمتها المحتملة. 
ومع ذلكء يعد فحص ال متوسطات والتباينات مثابة فحص مزدوج مفيد مجرد إجراء اختيار 
Gare‏ للبنود على أساس الارتباطات المتبادلة. 


البعدية (الأبعاد): 


إن مجموعة من البنود ليست بالضرورة أن تشكل مقياساً. قد لا يكون للبنود متغير 
أساسي مشترك LS)‏ هو الحال في المؤشر index‏ أو المتغير (CSL‏ أو قد يكون لها عدة 
متغيرات. يُعد تحديد طبيعة المتغيرات الكامنة التي تقوم عليها مجموعة بنود أمراً بالغ 
الأهمية. على سبيل JELI‏ الافتراض الذي يستند عليه معامل “LAI”‏ هو أن مجموعة 
البنود تكون أحادية البعد. وأفضل وسيلة لتحديد أي مجموعات ogil‏ إن وجدت» تشكل 
مجموعة أحادية البعد هو التحليل العاملي. liag‏ الموضوع مهم ما فيه الكفاية بحيث 
يستحق Shad‏ كاملاً (انظر الفصل السادس). وعلى الرغم من أن التحليل العاملي يتطلب 
أحجام عينات كبيرةء فإن تطوير المقياس بشكل عام يتطلب laf‏ عينات GIS‏ أحجام كبيرة. 
وإذا كان هناك عدد قليل جداً من المجيبين على التحليل dolli‏ فإن عملية تطوير المقياس 
برمتها قد تتعرض للخطر. وبالتاليء ينبغي أن يكون التحليل العاملي من أي نوع بشكل عام 
جزءاً من عملية وضع وتطوير المقياس في هذه ال مرحلة. 
الثبات (الموثوقية): 

من بين المؤشرات الأكثر أهمية لجودة المقياس هو معامل LG!‏ ألفا. في الواقع إن 
كل مشالل البنود التي تمت مناقشتها حتى الآن - تتمثل في المتوسط اللامركزيء والتباين 
الضعيفء والارتباطات السلبية بين og dl‏ والارتباطات المنخفضة بين المقياس والبندء 
والارتباطات الضعيفة بين البنود وبعضها البعض - ستميل إلى تقليل معامل ”ألفا“ وربما 
تبرر استخدام مؤشر بديلء مثل معامل ”أوميغا“. لذلك؛ بعد أن نختار البنود الخاصة بنا - 
نقوم بالتخلص من agil‏ الفقيرة والاحتفاظ بالبنود الجيدة - ويُعد معامل ”ألفا“ إحدى 
طرق تقييم مدى نجاحناء على افتراض أن البنود تلبي وتفي بالافتراضات الخاصة باستخدام 
معامل ”ألفا“. إن معامل ”ألفا“ هو مؤشر على نسبة التباين في درجات المقياس التي تُعزى 
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إلى الدرجة الحقيقية. وهناك العديد من الخيارات لحساب معامل “WP‏ تختلف في درجة 
dca‏ (أي استخدام آلات الحوسبة). تحتوي بعض حزم الحاسب الآلي على برامج لتحليل 
البنود التي تقوم بحساب معامل ”ألفا“. في الحزمة الإحصائية للعلوم الاجتماعية والمعروف 
اختصاراً ببرنامج SPSS‏ يحسب الإجراء RELIABILITY‏ معامل “WI‏ للمقياس بالكامل 
ولجميع النسخ )1 - (k‏ (أي لكل نسخة ممكنة مع حذف بند واحد). ويوفر البرنامج أيضًا 
الارتباطات المصححة وغير المصححة بين المقياس والبند. ويتضمن برنامج ”نظام التحليل 
الإحصائي “statistical analysis system‏ والمعروف اختصاراً SAS goblin‏ حسابات معامل 
“Lai”‏ كخاصية لإجراء الارتباطء وال معروفة ب PROC CORR‏ من خلال إدراج الخيار 
ALPHA “ai”‏ في بیان PROC CORR‏ سيتم التعامل مع المتغيرات المدرجة في بيان 
VAR‏ على أنها مقياس وسيتم حساب معامل ”ألفا“ للمجموعة الكاملة من البنود وكذلك 
جميع مجموعات البنود )1 - (kK‏ ا ممكنة. كما يوفر أيضاً الارتباطات بين المقياس والبند. 
وهناك خيار آخر لحساب معامل “WI”‏ هو القيام بذلك يدوياً. في حالة توفر تباينات 
لكل بند من البنود على حدة والمقياس SSS‏ فيمكن التعويض بهم في المعادلة أو الصيغة 
الأولى ل حساب معامل “WI”‏ التي تمت مناقشتها في الفصل الثالث. أو يمكن استخدام 
صيغة أو معادلة ”سبيرمان - براون“ Spearman-Brown‏ والتي تم تقد ھھا أيضًا في الفصل 
الثالث. وتستخدم هذه المعادلة المعلومات المتوفرة من مصفوفة ارتباط Vay‏ من التباينات 
كأساس لحساب معامل “WI”‏ ويتمثل أحد أوجه القصور في هذا النهج أو الطريقة في أن 
الارتباطات عبارة عن تغايرات موحدة (أي تمت معايرتها)» وقد تؤثر معايرة البنود كل على 
حدة على dad‏ معامل “LWP‏ وإذا تم الالتزام بدقة بنموذج الاختبارات المتكافئة, فهذا أمر 
غير منطقي أو غير مهم لأن الارتباطات يفترض أن تكون متساوية. ومع WS‏ فهي تقريباً 
لا تكون متساوية Lele‏ لا يتطلب نموذج الصورة الأساسية Volek‏ ”تاو“ وجود ارتباطات 
متساوية بين البنود. بل يتطلب فقط وجود تغايرات متساوية. وبالتالي» فإن نسبة تباين 
كل بند على حدة والتي تعزى إلى الخطأ لا تختلف في إطار هذا النموذج. ومع ذلك ونظرًا 
لأن صيغة ”سبيرمان - براون“ تعمل بالفعل مع متوسط الارتباطات المتبادلة بين البنودء 
وأن من بين الآثار المترتبة على نموذج الصورة الأساسية معادلة ”تاو“ أن متوسط ارتباطات 
المقياس بالبند يكون متساوياً لكل ay‏ فإنه لا توجد هناك مشكلة. ومع ذلكء يمكن أن 
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تكون هناك فروق صغيرة (ولكن كبيرة في بعض الأحيان) بين قيم معامل ”ألفا“ التي يتم 
الحصول عليها من الطرق الحسابية المستندة إلى التغاير مقابل الطرق الحسابية القائمة على 
الارتباط. ونظرًا لأن مصفوفة التغاير تستخدم البيانات بشكل أنقى أو خام (بدون معايرة 
أي توحيد القياس). فهي مفضلة ويجب استخدامها بشكل عام. 


ومن الناحية النظرية: يمكن أن يأخذ معامل ”ألفا“ القيم من ”"صفر“ إلى ”الواحد 
“peal‏ على الرغم من أنه من غير المرجح أن يحقق معامل WP‏ أيّا من هذه القيم 
المتطرفة. إذا كانت قيمة معامل “LI”‏ سالبةء فهناك خطأ ما. وتتمثل المشكلة المحتملة في 
الارتباطات السالبة (أو التغايرات) بين البنود. إذا Us Sue‏ فحاول عكس الدرجات عند 
تسجيلها reverse scoring‏ أو حذف البنود كما هو موضح سابقًا في هذا الفصل. ويقترح 
”نونالي“ )1978( Nunnally‏ القيمة (+,V+)‏ كحد Gal‏ مقبول لمعامل ”ألفا“. ليس من 
غير المألوف رؤية المقايبس المنشورة ذات قيم منخفضة لمعامل “LAM”‏ مختلف علماء 
امنهجية والباحثون المختلفون بدأوا مرتبكين بشأن مستويات مختلفة من معامل SWI”‏ 
وأفضل بصفة شخصية Gab‏ أو قيم معامل «ألفا» للمقاييس البحثية على النحو التالي: 
أقل من )+451( غير gee‏ بين (ST)‏ و(0,10) غير مرغوبء بين (0,10) 9 (V+)‏ الحد 
الأدنى المقبولء وبين (OV)‏ و(۰,۸۰) oe‏ وبين (A)‏ و(۰,۹۰) جيد das‏ وأكبر بكثير من 
)+58( ينبغي للمرء أن يفكر في أن يقلل من طول المقياس (انظر القسم التالي). وأود أن 
أؤكد أن هذه المجموعات هي شخصية وذاتية لقيم معامل «ألفا». ولا أستطيع الدفاع 
عنها على أسس عقلانية بحتة. ومع US‏ فإنها تعكس تجربتي وخبرتي ويبدو أنها تتداخل 
بشكل كبير مع تقييمات الباحثين الآخرين. تنطبق القيم التي اقترحتها على معاملات «ألفا» 
المستقرة. وآثناء التطوير, يتم اختيار البنود» إما بشكل مباشر أو غير مباشر, على أساس 
مساهمتها في معامل « ألفا». وقد يُعزى بعض التغاير الظاهري بين البنود إلى الصدفة. 
لذلك؛ من المستحسن خلال مرحلة التطوير أن نسعى إلى الحصول على معاملات «ألفا» 
أعلى قليلاً مما ترغب فيه. وإذا ما تدهورت قيم معامل «ألفا» بعض الشيء عند استخدامها 
في سياق بحثي جديد» فإنها ستظل مرتفعة بشكل مقبول إلى a>‏ ما. وكما SS‏ سابقاء إذا 
كانت dus‏ التطوير صغيرة. فيجب أن يكون الباحث قلقًا بشكل خاص من أن التقديرات 
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الأوّلية لمعامل «ألفا» التي يتم الحصول عليها أثناء تطوير المقياس قد لا تكون مستقرة. 
وكما assw‏ فإن هذا هو الحال أيضًا عندما يكون عدد البنود التي تشكل المقياس صغيراً. 

ومن المواقف أو الحالات التي لا تنطبق عليها «نطاقات الراحة» comfort ranges‏ 
المقترحة لمعامل “WI”‏ عندما يتم تطوير مقياس يتطلب دقة بالغة الأهمية. وتعتبر 
الحالات السريرية مثالاً على ذلك. وتكون الإرشادات المقترحة «الطبادئ التوجيهية» مناسبة 
للأدوات البحثية التي ستستخدم مع بيانات المجموعات. على سبيل JELI‏ من المحتمل أن 
يكون المقياس الذي تبلغ قيمة معامل «ألفا» له Gulia (+,A0)‏ تمامًا للاستخدام في دراسة 
تقارن بين المجموعات فيما يتعلق با مفهوم البنائي الذي يتم قياسه. يتطلب التقييم الفرديء 
ولاسيما عندما تعتمد القرارات المهمة على هذا التقييم» مستوى أعلى من ذلك بكثير. إن 
المقاييس المخصصة للتشخيص الفرديء أو التوظيفء أو التوظيف الأكادهي» أو غير ذلك 
من الأغراض المهمة ينبغي أن تكون لها درجة أعلى من الثبات» في منتصف التسعينيات» 
على سبيل المثال. 

في بعض الحالات» مثل الحالات التي يتكون فيها المقياس من بند واحد» سيكون من 
المستحيل استخدام معامل “WI”‏ كمؤشر للثبات. وإذا كان ذلك Eoo‏ فيجب إجراء 
تقييم معين للثبات. وقد يكون ارتباط إعادة الاختبار Test-retest correlation‏ هو الخيار 
الوحيد في حالة المقياس المكون من بند واحد. وعلى الرغم من أن مؤشر الثبات هذا غير 
كاملء كما هو موضح في الفصل CSW‏ فإنه من الواضح أنه أفضل من عدم تقييم الثبات 
على الإطلاق. والبديل Laat!‏ إن «Sel‏ هو تشكيل وتكوين اممقياس باستخدام AST‏ من 
بند واحد. 

وكما هو مذكور في الفصل الثالث» OLS‏ معامل ”أوميغا“ هو بديل عامل ”ألفا“ الذي 
قد يكون مناسباً عندما لا يتم الوفاء بالافتراضات الخاصة باختبارات معادلة التكافؤ الأساسي 
ل ”تاو“ essentially tau-equivalent tests‏ وكما ذكرت Las]‏ في ذلك الفصلء» إن ”دان 
وآخرين“ )2014( Dunn et al.‏ و”بيترز“ )2014( Peters‏ يقدمون إرشادات لاستخدام 
البيئة الإحصائية (R)‏ لحساب معامل ”أوميغا". 
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الخطوة الثامنة: تحقيق الحد الأمثل لطول المقياس: 


تأثير طول المقياس على الثبات: 

في هذه المرحلة من عملية تطوير ا مقياس» يكون لدى الباحث تجمع من البنود التي 
تظهر ثبات بدرجة مقبولة. ويتأثر معامل «ألفا» للمقياس بخاصيتين هما: مدى التغاير 
بين البنود وعدد البنود في المقياس. بالنسبة للبنود التي لها ارتباطات بين اممقياس والبند 
يساوي متوسط الارتباط بين البنود وبعضها البعض asl)‏ البنود التي تكون نموذجية إلى حد 
«(Le‏ سيؤدي إضافة المزيد منها إلى زيادة قيمة معامل «ألفا» وحذف المزيد منها سيقلل 
dad‏ معامل «ألفا». وبوجه cele‏ تكون المقاييس الأقصر (القصيرة إلى حد كبير) جيدة لأنها 
تلقي عبئاً أقل على المجيبين. ومن ناحية أخرىء فإن المقاييس الأطول تكون جيدة لأنها 
تميل إلى أن تكون أكثر GLE‏ ومن الواضح أن تعظيم أحد هذه الأصول من شأنه أن يقلل 
من الآخر. ولذلك؛ ينبغي على مطور المقياس أن يعطي بعض التفكير في المفاضلة المثلى بين 
الإيجاز «الاختصار» والثبات. 

إذا كان ثبات أي مقياس منخفضاً ALU‏ فإن الإيجاز لا يكون فضيلة أو نقطة قوة. وقد 
يكون الأشخاصء في الواقع, أكثر استعداداً للإجابة على مقياس مكون من ثلاث بنود أكثر من 
استعدادهم للإجابة على مقياس مكون من عشرة بنود. ومع US‏ إذا م يتمكن الباحث 
من تعيين أي معنى للدرجات التي تم الحصول عليها من نسخة المقياس الأقصرء فلن يتم 
تحقيق أي شيء. Flag‏ على WS‏ ينبغي أن تقتصر مسألة المقايضة بين الثبات والإيجاز على 
الحالات التي يكون فيها لدى الباحث «ثباتاً احتياطيا». وإذا كان الأمر MIS‏ في الواقع, 
فقد يكون من المناسب تبني مقياس أقصر مقابل التضحية بقليل من الثبات. 


آثار استبعاد وإسقاط البنود السيئة: 

سواء كان إسقاط واستبعاد البنود «السيئة» في الواقع يزيد أو يخفض قليلاً قيمة معامل 
«ألفا» فإن ذلك يعتمد على مدى ضعف البنود التي سيتم إسقاطها واستبعادها وعلى عدد 
البنود ال موجودة في المقياس. لنتأمل هنا التأثير الذي يسببه عدد كبير أو قليل من البنود 
والتي تكون «جيدة» بنفس القدر gl)‏ التي لها ارتباطات مماثلة مع نظيراتها): في حالة 
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وجود عدد أقل من البنود. فإنه سينتج عن إضافة كل بند أو حذفه تغير أكبر في معامل 
«Latin‏ إذا كان متوسط الارتباط ال متبادل بين البنود وبعضها البعض لعدد أربعة بنود 
هو )+0,+( فإن معامل “WI?‏ سوف يساوي (A)‏ وإذا كان هناك ثلاثة بنود فقط 
متوسط ارتباط Jalis‏ بين بعضها البعض قدره )+0,+( فإن معامل ”ألفا“ سوف ينخفض 
إلى .(+,VO)‏ وف حالة وجود خمسة بنود لها نفس متوسط الارتباط فإن معامل “LWP?‏ لها 
سيبلغ (AY)‏ وبالنسبة للمقايبس التي تتألف من ٩‏ و١٠‏ و١١‏ بنداً مع متوسط ارتباطات 
متبادلة بين البنود وبعضها البعض قدره )+0,+( فإن معامل ”ألفا“ سيبلغ ٠,١١ cts)‏ 
٠,۲‏ ) على التوالي. في الحالات الأخيرةء OB‏ معاملات “WP‏ ليست فقط أعلى ولكن أيضًا 
أقرب بكثير في القيمة من بعضها البعض. 

إذا كان للبند ارتباط أقل من المتوسط بدرجة كافية مع البنود الأخرىء» فإن إسقاطه 
واستبعاده سيرفع قيمة معامل ”ألفا“. وإذا كان متوسط ارتباطه بالبنود الأخرى أقل قليلاً 
(أو يساوي أو يزيد) من المتوسط AII‏ فإن الاحتفاظ بالبند سيزيد dad‏ معامل ”ألفا“. 
وقد ذكرت ode]‏ أن مقياس مكون من أربعة بنود سيحصل على معامل “WP‏ قدره (eA)‏ 
مع وجود متوسط ارتباط متبادل بين البنود وبعضها البعض قدره )+0,+(. ولكن ما مقدار 
انخفاض متوسط ارتباط أحد البنود بالبنود الثلاثة الأخرى للمساعدة في اتخاذ قرار باستبعاد 
هذا العنصر Vos‏ من إلحاق الضرر بمعامل «ألفا»؟ Vol‏ فكر في متوسط الارتباط بين البنود 
الذي ينبغي أن يكون عليه ممقياس مكون من ثلاثة ogi)‏ لتحقيق معامل ”ألفا“ قدره (A+)‏ 
سيلزم أن يكون متوسط الارتباط بين البنود هو UL .(+,0V)‏ فبعد استبعاد أسوأ البنود 
الأربعة» ستحتاج البنود الثلاثة المتبقية إلى متوسط ارتباط متبادل Loud‏ بينها قدره (+,0V)‏ 
حتى تحافظ على dad‏ معامل “WI”‏ تساوي (A)‏ وسيكون لثلاثة بنود متوسط الارتباط 
فيما بينها أقل من (+,0V)‏ معامل “WI”‏ أقل من أربعة بنود يبلغ متوسط الارتباط المتبادل 
بين بعضها البعض .)٠,0١(‏ وإذا افترضنا أن أفضل ثلاثة بنود في مقياس مكون من أربعة 
بنود كان متوسط الارتباط فيما بينها يساوي (20,01). OL‏ متوسط الارتباط بين البند المتبقي 
(وبالتالي الأسوآ) والبنود الثلاثة الأخرى LY‏ أن يكون أقل من )٠,٤١(‏ لكي يؤدي استبعاده 
إلى زيادة قيمة معامل ”ألفا“ فعلياً. [إن وجود ثلاثة بنود يبلغ متوسط الارتباط المتبادل 
فيما بينها (+,0V)‏ وبند واحد يبلغ متوسط ارتباطه مع البنود الثلاثة الأخرى (SEY)‏ ينتج 
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عن ذلك متوسط ارتباط متبادل بين البنود الأربعة بشكل عام قدره (0,20)]. بالنسبة GY‏ 
قيمة أكبر من OB (EF)‏ وجود بند رابع يكون أكثر فائدة من خفض متوسط الارتباط بين 
البنود يؤدي إلى الضرر. وبالتالي» يجب أن يكون البند «السيئ» أسوأ قليلاً من البنود الثلاثة 
الأخرى (۰,0۷ - ۰,٤۳‏ = 0,15) التي تستحق استبعادها. 


والآن» فكر في الموقف عندما يكون هناك مقياس مكون من عشرة بنود وله معامل 
«ألفا» قدره .)٠,۸٠(‏ أولاً وقبل كل شيء» يجب أن يكون متوسط الارتباط بين البنود حوالي 
(059) فقطء مما يوضح الطريقة التي يعوض بها وجود المزيد من البنود الارتباطات 
الأضعف فيما بينها. ولي يحقق مقياس مكون من تسعة بنود نفس قيمة معامل alaf»‏ 
يجب أن يكون متوسط الارتباط بين البنود حوالي .)٠,۳١(‏ ولا بد أن يكون للبند «السيئ» 
متوسط ارتباط متبادل مع البنود التسعة المتبقية (Y)‏ أو أقل حتى يتسنى إدراجه كبند 
pile‏ لسحب وخفض المتوسط ASU)‏ للارتباط المتبادل بين البنود إلى ما دون .)٠,۲۹(‏ قد 
يؤدي الفشل في خفض المتوسط إلى ما دون هذه القيمة إلى استفادة معامل “WI”‏ من 
إدراج وتضمين البند. ويبلغ متوسط فرق الارتباط بين البنود التسعة ”الجيدة“ وبين البند 
الوحيد ”السيئ“ في هذه الحالة (۰,۳۱ - »)٠,١١ = ٠,۲۰‏ وهو فرق أصغر من فرق الموجود 
في مثال المقياس المكون من البنود الأربعة. 


ضبط وإصلاح طول المقياس: 


كيف هكن للمرء أن يقوم بإصلاح أو «ترقيع» tinkering‏ طول المقياس في الممارسة 
العملية؟ من الواضح أن البنود التي تسهم بأقل قدر في الاتساق الداخلي العام ينبغي أن 
تكون أول البنود التي يتم النظر في استبعادها. ويمكن تحديد هذه البنود بعدة طرق. 
يُظهر إجراء GLU!‏ باستخدام برنامج “SPSS”‏ وخيار ”ألفا“ “ALPHA”‏ الخاص بالبرتوكول 
PROC CORR‏ في برنامج “SAS”‏ تأثير حذف كل بند على معامل ”ألفا“ الكلي. وعادة 
ما يكون البند الذي يكون لإسقاطه وحذفه أقل تأثير سلبي أو أكبر تأثير إيجابي على معامل 
«ألفا» هو أفضل بند ينبغي إسقاطه وحذفه أولاً. ويمكن أيضًا استخدام ارتباطات المقياس 
بالبند كمقياس للبنود القابلة للاستنفاذ (أي القابلة للحذف والإسقاط). ويجب Vol‏ 
إسقاط واستبعاد تلك البنود التي لديها Gol‏ مستوى من الارتباطات بين المقياس والبنود. 
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كما يوفر البرنامج الإحصائي “SPSS”‏ أيضًا الارتباط المتعدد التربيعي squared multiple‏ 
JN correlation‏ 44 يتم الحصول عليه عن طريق انحدار البند على جميع البنود المتبقية. 
وهذا يكون تقدير لتشاركية communality‏ البند» ومدى تقاسمه التباين مع البنود 
الأخرى. وكما هو الحال مع ارتباطات المقياس بالبندء فإن البنود التي لها ارتباطات متعددة 
تربيعية في Gol‏ مستوى ممكن LY‏ أن تكون هي البنود الرئيسية المرشحة للاستبعاد. 
وبصفة Aisle‏ تتقارب وتتلاقى هذه المؤشرات المختلفة لجودة البند. وعادةً ما يصاحب 
الارتباط الضعيف للمقياس بالبند ارتباط متعدد تربيعي منخفض وانخفاض go‏ أو حتى 
dob}‏ في معامل ”ألفا“ عند اسقاط واستبعاد البند. يؤثر طول المقياس على دقة معامل 
“WI”‏ ومن الناحية العمليةء فإن معامل ”ألفا“ ا محسوب هو تقدير للثبات يعتمد على 
مدى ملاءمة افتراضات القياس للبيانات الفعلية. وقد hog‏ بالفعل أن معامل “WI‏ يزداد 
Louis‏ يتم تضمين وإدراج المزيد من البنود be)‏ م تكن بنود فقيرة نسبيًا). وبالإضافة إلى 
ذلك» يزداد ثبات «ألفا» كتقدير للثبات مع زيادة عدد البنود. Mag‏ يعني أن معامل ”آلفا“ 
المحسوب hab‏ أطول سيكون له فترة ثقة أضيق حوله أكثر من معامل ”ألفا“ المحسوب 
ممقياس أقصر. وفي جميع التطبيقات» سيسفر المقياس الأطول عن قيم لمعامل ”ألفا“ أكثر 
تشابهاً Dyli‏ ما سيسفر dis‏ مقياس أقصر. وينبغي أن تؤخذ هذه الحقيقة في الاعتبار 
عند تحديد طول أو إيجاز (اختصار) المقياس أثناء عملية التطوير. 


sly‏ من امهم أن نتذكر أنه يجب تضمين هامش أمان في معامل “WP‏ عند محاولة 
تحسين طول المقياس. قد ينخفض معامل “WWI”‏ إلى حد ما عندما يتم (تطبيق) المقياس 
على dus‏ أخرى غير العينة ا مستخدمة في تطويره. 


تقسيم العبنات: 

إذا كانت عينة التطوير كبيرة ا فيه ALE!‏ فقد يكون من الممكن تقسيمها إلى عينتين 
فرعيتين. ويمكن أن تكون إحداهما بمثابة عينة التطوير الأساسيةء ويمكن استخدام الأخرى 
للتحقق من النتائج المتحصل عليها. UU‏ على سبيل JELI‏ يمكن استخدام البيانات من 
العينة الفرعية الأولى لحساب معامل «آلفا»» وتقييم البنود. وضبط أو إصلاح طول المقياس, 
والتوصل إلى نسخة نهائية من المقياس تبدو مثالية. ويمكن بعد US‏ استخدام العينة 


€ تطوير المقاييس: النظرية والتطبيق 


قواعد إرشادية في تطوير المقياس 


الفرعية الثانية لتكرار هذه النتائج. ولن يستند اختيار البنود التي ينبغي الاحتفاظ بها على 
الإطلاق إلى العينة الفرعية الثانية. وبالتالي» فإن معاملات «ألفا» وغيرها من الإحصاءات 
المحسوبة لهذه المجموعة لن تظهر تأثيرات الصدفة chance‏ مثل تضخم معامل WP”‏ 
الذي تمت مناقشته في وقت سابق. إذا ظلت معاملات «ألفا» ثابتة إلى حد ما عبر العينتين 
الفرعيتين» فيمكنك أن تكون JST‏ ارتياحاً لافتراض أن هذه القيم غير مشوهة عن طريق 
الصدفة. وبطبيعة led!‏ من المرجح أن تكون العينتين الفرعيتين أكثر تشابهاً من عينتين 
مختلفتين تماماً. ومن المرجح أن تكون العينات Aye A‏ والتي يتم تقسيمها بشكل عشوافي 
من dus‏ تطوير بأكملهاء ممثلة للمجتمع الإحصاني؛ وعلى النقيض من US‏ قد تكون عينة 
جديدة تماماً ممثلة لمجتمع Glas]‏ مختلف بعض الشيء. كما أن فترات جمع البيانات 
للعينتين الفرعيتين لا يفصل بينها الزمنء في حين أن عينة التطوير وعينة منفصلة تماما 
على الدوام» يتم فصل الفترات الزمنية في جمع البيانات. وعلاوة على US‏ فإن أي شروط 
dole‏ قد يكون تم تطبيقها على جمع البيانات لعينة فرعية واحدة يتم تطبيقها با مثل على 
العينة الفرعية الأخرى. ومن الأمثلة على الظروف الخاصة التعرض لأفراد بحث معينين» 
والإعدادات doll‏ ووضوح طباعة الاستبيانات. MIS‏ قد تكون العينتان الفرعيتان هما 
المجموعتان الوحيدتان اللذان يكملان الإجابة على بنود المقياس مع كافة البنود من التجمع 
الأصلي للبنود التي تم رفضها في نهاية المطاف. وإذا كانت البنود المرفوضة قد مارست أي 
تأثير على الاستجابات على بنود المقياس» فإن هذه البنود ستكون AL‏ للمقارنة بالنسبة 

Ass‏ الرغم من التشابه الفريد بين العينات الفرعية الناتجة. OLS‏ تكرار النتائج عن 
طريق تقسيم عينة التطوير يوفر معلومات ذات قيمة حول استقرار المقياس. وتختلف 
العيّنتان الفرعيتان في جانب رئيسي واحد: ففي حالة العينة الفرعية الأولى التي استند 
على بياناتها في اختيار dgidl‏ توجد فرصة لخلط عوامل عدم الاستقرار والصدفة مع التغاير 
الموثوق بين البنود. ولا توجد فرصة من هذا القبيل لإسناد أو عزو نتائج الصدفة بصورة 
منهجية «منتظمة» إلى الثبات بالنسبة للمجموعة الثانية OY‏ بياناتها 6 تؤثر على اختيار 
البنود. وهذا الاختلاف المهم هو سبب كاف لتقييم المعلومات التي هكن أن يوفرها 
تقسيم Cbs‏ ق ode‏ المرحلة من تظوير المقيامن. 
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إن الطريقة الأكثر وضوحاً لتقسيم عينة كبيرة بالقدر الكافي هو تقسيمها إلى نصفين. 
ومع ذلك إذا كانت العينة صغيرة جداً بحيث Y‏ يمكن أن يسفر تقسيمها عن نصفين كبيرين 
بشكل SIS‏ فإنه يمكنك تقسيمها بشكل غير متساو. ويمكن استخدام العينة الفرعية الأكبر 
في العملية الأكثر أهمية لتقييم البنود وبناء المقياس واستخدام العينة الفرعية الأصغر 
للتحقق من صلاحية المقياس .cross-validation‏ 


تمارين: 
افترض أنك تقوم بتطوير مقياس «الخوف من الثعابين» الذي يحتوي على صيغ استجابة 

«ليكرت» مكون من ستة خيارات» وتم تطبيقه على ٠٠١‏ شخص. على الرغم من أن المزيد 

من البنود سيكون أمراً مرغويًا فيه لتطوير المقياس الفعليء إلا أنه يمكنك إكمال الخطوات 

التالية لهذه التمارين: 

-١‏ قم بإنشاء تجمع من عشرة بنود على شكل مقياس «ليكرت». 

-Y‏ بالنسبة لكل بند قمت بكتابته. قم بتقدير قيم مقياس ”ليكرت“ التي سيتم إقرارها من 
قبل ”الشخص العادي“ gl)‏ لا يوجد فوبيا من الثعابين أو ساحر الثعابين). 

Sole اختر بنداً من تجمع البنود تعتقد أنه قد يستخلص استجابة متطرفة من شخص‎ -Y 
ثم أعد صياغتها للحصول على استجابة أكثر اعتدالاً.‎ 

€- قم بتوليد وتكوين عشرة بنود أخرى من نوع مقياس «ليكرت» لقياس مفهوم بنائي آخر 
غير الخوف من الثعابين» ثم قم مزج أو خلط هذه sgil‏ عشوائياً مع البنود العشرة 
الأصلية واطلب من بعض الأصدقاء أن يشيروا إلى ما يعتقدون حول ما يهدف كل بند 
من البنود إلى قياسه. 

0- ما هي إيجابيات وسلبيات slo‏ البنود التي يكون لها عدد زوجي مقابل البنود التي 
يكون لها عدد فردي من خيارات الاستجابة؟ 

1- باستخدام Le]‏ مفهوم الخوف من الثعابين أو المفهوم البنائي الأساسي الذي تقوم عليه 
المجموعة الثانية المكونة من عشرة بنود. قم بتدوين السلوكيات التي يمكن ملاحظتها 
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بشكل مباشر والتي يمكن استخدامها للتحقق من صدق مقياس يقيس ذلك البناء واشرح 
كيف MS‏ استخدام البيانات السلوكية للتحقق من الصدق. 
-V‏ ما قيمة معامل “WI?‏ بالنسبة للمقياس إذا كان متوسط الارتباط المتبادل بين البنود 
العشرة لمقياس الخوف من الثعابين يساوي SC)‏ 
-A‏ كيف هكنك استخدام العينات المقسمة لتقدير معامل ”ألفا“ للمقياس والتحقق من 
الصدق عبر العينات؟ 


ملاحظات: 


-١‏ الإجابة: WI‏ = [۱۰ * 5%[ / [۱ + (9 * عاره)] = ۸ر 
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YA 


الفصل السادس 
التحليل العاملي 


في الفصل الثانيء عند مناقشة النماذج النظرية المختلفة التي يمكن أن تصف علاقة بنود 
المقياس بالمتغير الكامن» تمت الإشارة إلى النموذج العاملي العام. هذا النموذج م يفترض 
أن متغيراً كامناً واحداً فقط هو juas‏ كل التغاير covariation‏ بين البنود. ولكن بدلاً من 
US‏ يسمح هذا النموذج بمتغيرات كامنة متعددة لأن تكون كأسباب للتباين في مجموعة 
من البنود. 

لتوضيح كيف هكن WV‏ من متغير كامن أن يكون Lulul‏ لمجموعة من dgidl‏ سنعيد 
النظر في حالة محددة. وإن كان افتراضيًاء تمت مناقشته في الفصول السابقة. يمكن تعريف 
العديد من اطفاهيم البنائية constructs‏ التي تهم علماء الاجتماع والسلوك إجرائياً عند 
مستويات متعددة معينة. وتعتبر مفاهيم التكيف النفسيء والتأثير. والتأثير السلبيء 
والقلقء والقلق الاجتماعيء وقلق مواجهة الجمهور أمثلة على الظواهر الهرمية. حيث 
يمكن لكل مفهوم من هذه المفاهيم أن يستوعب تلك التي تتبعه في القائمة, مع إمكانية 
تطوير مقاييس عند كل مستوى معين. افتراضياً هكن للبنود GIS‏ الصياغة المختلفة بأطر 
زمنية وخيارات استجابة مختلفة تتعلق Le]‏ مستوى معين أو متوسط أو عام من هذا 
التتابع. ونأمل أن يقوم مطور المقياس باختيار صيغ البنود التي تتوافق مع ا مستوى المحدد 
للمتغير. عندئذ» يمكن استخدام التحليل العاملي لتقييم نجاح عملية الاختيار هذه. 

لجعل هذا JEL‏ أكثر تحديدًا. خذ ف الاعتبار مجموعة مكونة من YO‏ بنداً متعلقة 
بالتأثير. وتذكر أن أحد افتراضات نظرية الالستجابة للبند Item Response Theory‏ هو 
أن البنود التي تشكل مقياساً هي أحادية البعد - أي أنها تتعلق بمفهوم بنائي واحد فقط. 
وبالتالي» فإن ما يهمنا هو ما إذا كانت هذه البنود ال YO‏ ينبغي أن تشكل Úle Lilie‏ 
أو عدة مقاييس خاصة. هل جميع البنود ال VO‏ تشكل مقياساً واحداً al‏ أنه من الأنسب 
أن يكون هناك مقاييس منفصلة لحالات التأثير المختلفة, مثل الاكتئاب والنشوة والعداء 
والقلق» وما إلى ذلك؟ بل Ley‏ حتى سيكون من الأفضل تقسيم بنود التأثير الإيجابية 
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والسلبية (على سبيل JEL‏ ”سعيد“ مقابل ”حزين“ للاكتئاب أو ”متوتر“ مقابل ”الهدوء“ 
للقلق) إلى مقاييس منفصلة. كيف نعرف ما هو الأنسب للبنود محل الدراسة؟ وبالأحرىء 
فإن السؤال الذي يطرح نفسه هو: هل مجموعة البنود المتعلقة بالعديد من حالات التأثير 
ناشئة من متغير كامن واحد أو من العديد من المتغيرات الكامنة؟ 

محاولة الإجابة على هذه الأسئلة مع استبعاد أسلوب التحليل العاملي والاعتماد فقط 
على الأساليب التي تمت مناقشتها في الفصول السابقة ستكون مهمة شاقة. يمكننا حساب 
a Jles‏ على كامل مجموعة بنود المزاجية: علماً أن معامل LAT‏ يخبرنا عن كمية التباين 
ا مشترك في مجموعة من البنود. إذا كانت ألفا منخفضة, فقد نبحث عن مجموعات فرعية 
من البنود التي ترتبط بقوة أكبر مع بعضها البعض. على سبيل SEL‏ قد نشك في أن بنود 
التأثير الإيجابية والسلبية لا ترتبط مع بعضها البعض وأن الجمع بينها يؤدي إلى خفض 
Lal‏ لذا يفترض أن تكون قيم WI‏ لهذه المجموعات الفرعية الأكثر تجانسًا (كلها إيجابية 
أو سلبية التأثير) أعلى. قد نفترض بعد ذلك أنه حتى المجموعات الفرعية الأكثر Lisl‏ 
(على سبيل lb)‏ فصل القلق عن الاكتئاب بالإضافة إلى الإيجابي من السلبي) يجب أن 
تكون قيم ألفا لها أعلى. ومع WS‏ في مرحلة ماء قد نشعر بالقلق أيضًا من أن هذه 
المقاييس الأكثر تحديدًا وا متجانسة سوف ترتبط ارتباطًا وثيقًا مع بعضها البعض لأنها كانت 
فقط مجرد جوانب مختلفة لنفس حالة التأثين وهذا من شأنه أن يوحي GL‏ بنود تلك 
المقاييس تنتمي إلى نفس المقياس وليس إلى مقاييس منفصلة. يجب التأكيد على أن ألفا 
عالية نسبياً ليست ضماناً على أن جميع البنود تعكس تأثير متغير كامن واحد. فإذا كان 
هناك مقياس مكون من dus YO‏ حيث WY‏ بنداً تعكس ف المقام الأول متغيراً كامناً واحداً 
وال ١١‏ بنداً الأخرى تعكس متغيراً كامناً آخر» فإن مصفوفة الارتباط لجميع البنود يجب 
أن يكون لها بعض القيم العالية وبعض القيم المنخفضة. لذا يفترض أن تكون الارتباطات 
القاامة على بندين يمثلان نفس امتغير الكامن dle‏ وتلك التي تعتمد على بنود تعكس 
بشكل أساسي متغيرات كامنة مختلفة ينبغي أن تكون منخفضة Gud‏ ومع ذلك قد يكون 
متوسط الارتباط بين البنود مرتفعًا ما يكفي لإنتاج قيمة مقبولة WI‏ لمقياس مكون من 
0 بنداً. في الواقع» للحصول على قيمة ألفا تساوي ٠.٠١‏ ممقياس بهذا الطولء يجب أن 
يكون متوسط الارتباط بين البنود فقط .0,١6‏ وبالتالي» مع وجود بنود تقيس نفس المفهوم 
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البتای مرتبطة مقدار ٠,۲۹‏ (ارتباط متوسط مقبول ولكنه ليس eS‏ بشكل غير olizo‏ لبنود 
داخل مجموعة فرعية متجانسة) ووجود بنود بين مجموعات مرتبطة بمقدار Verses‏ تزال 
إمكانية الحصول على ألفا بمقدار ٠,8١‏ تقريباً قائمة. ولكنء بالطبع» يكون ألفا مناسبًا فقط 
مجموعة بنود أحادية WY sd!‏ قيمة الثبات reliability score‏ (أي قيمة ألفا) هذه 
ستكون مضللة كمؤشر على الاتساق الداخلي أو أحادية البعد (الذي نعرفه لا ينطبق في هذا 
المثال الافتراضي). إن التحليل العاملي» g gòga‏ هذا haill‏ هو أداة تحليلية مفيدة هكن 
أن تخبرناء ما لا هكن لمعاملات GLY!‏ أن تفعل» عن الخصائص المهمة للمقياس. ممكن أن 
يساعدنا تطبيقياً أو عملياً في تحديد عدد المفاهيم البنائية أو المتغيرات الكامنة أو العوامل 


وراء مجموعة بنود ما. 


نظرة عامة حول التحليل العاملي: 

يخدم التحليل العاملي dus‏ أغراض متصلة. وأحد وظائفه الرئيسية. كما لوحظ Blu‏ 
هو مساعدة الباحث في تحديد عدد المتغيرات الكامنة وراء مجموعة من البنود. وبالتالي» 
في حالة بنود التأثير البالغ عددها day YO‏ يمكن أن يساعد التحليل العاملي الباحث في 
تحديد ما إذا كانت هناك حاجة إلى بناء مفهوم بنائي واحد واسع أو عدة مفاهيم بنائية 
لتوصيف مجموعة البنود. أيضاً يمكن أن يوفر التحليل العاملي وسيلة لتفسير التباين بين 
العديد من المتغيرات الأصلية المتصلة نسبياً (على سبيل YO SEL‏ بنداً) باستخدام عدد 
قليل نسبياً من المتغيرات المنشأة (أي العوامل). وهذا يؤدي إلى تكثيف المعلومات بحيث 
يمكن حساب التباين باستخدام عدد متغيرات أقل. على سبيل SEM‏ بدلاً من الحاجة إلى 
YO‏ درجة (قيمة) لوصف كيفية إجابة المجيبين على البنود. قد يكون من الممكن حساب 
عدد أقل من الدرجات Ley)‏ حتى واحدة) Flo‏ على دمج البنود. الغرض الثالث من التحليل 
العاملي هو تحديد المحتوى الموضوعي أو معنى العوامل gl)‏ المتغيرات الكامنة) التي تفسر 
التباين بين مجموعة أكبر من البنود. يتم تحقيق ذلك عن طريق تحديد مجموعات من 
ogil‏ تتغاير covary‏ مع بعضها البعض وتبدو أنها تعرف متغيرات كامنة ذات معنى. إذاء 
على سبيل Las JELI‏ عاملان من تحليل بنود التأثير البالغ عددها day YO‏ فإن محتوى 
البنود الفردية التي تشكل مجموعات العوامل هذه يمكن أن تعطي فكرة عن المتغيرات 
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الكامنة التي تمثلها العوامل. الوظيفة الرابعة للتحليل العاملي ترتبط بالوظائف الثلاثة 
المذكورة سابقا. يساعد التحليل العاملي في تحديد البنود GIS‏ الأداء الأفضل أو الأسوأً. 
lls‏ تلك البنود الفردية التي لا تنسجم مع أي من فئات البنود المشتقة عاملياً أو التي 
تتناسب مع أكثر من واحدة من تلك الفئات العاملية يمكن تحديدها والنظر في إزالتها. 

تقدم الأقسام التالية ملخصًا مفاهيميًا للتحليل العامليء ويمكن للقراء الذين يريدون 
التعرف على ال معالجة الحسابية للتحليل العاملي بشكل أعمق الرجوع إلى المراجع ال مخصصة 
لهذا الموضوع. مثل )1983( Cureton‏ أو )1983( Gorsuch‏ أو )1976( Harman‏ 
أو )1984( .McDonald‏ 


أمثلة على الطرق المماثلة للمفاهيم التحليلية للعوامل: 


للحصول على تصور بديهي ما يقوم به التحليل العامليء USE‏ النظر في عمليتين أقل 
رسمية ولكنهما متماثلتان تقريبًا مع تلك التي Ley‏ تكون أكثر دراية بها. أول هذه العمليات 
يتم استخدامها في بعض الأحيان في إدارة الموارد البشرية لتحديد الموضوعات المشتركة بين 
القضايا المحددة التي تبدو متنوعة والتي قد تهم أعضاء الفريق أو زملاء العمل. 


مثال رقم 73 

افترض أن شركة صغيرة جديدة تريد تحديد الخصائص التي يعتقد موظفوها أنها مهمة 
لزملائهم في العمل للتحاي بها. إنهم يعتقدون أن تحديد ومكافأة الخصائص IS‏ القيمة 
على نطاق واسع سوف تلعب دوراً هاماً في تهيئة بيئة عمل متناغمة وتعاونية. وتقوم 
الشركة باستقطاب Glas)‏ موارد بشرية للمساعدتهم. يجمع هذا الأخصانيء الذي سنطلق 
عليه اسم جيم Jim‏ موظفي الشركة العشرة معا ويوضح أنه يود منهم أن يفكروا في 
خصائص زملائهم الموظفين الذين يعتبرونها مهمة في مجموعة التفاعلات التي قد تكون 
لديهم في asl‏ بدءًا من وضع المقترحات والتقارير Leo‏ إلى التفاعل مع العملاء ا محتملين 
ee‏ إلى مشاركة طاولة في الكافتيريا - المجموعة الكاملة من التفاعلات التي قد تكون لدى 
الموظفين. يقترح جيم أنه لبدء العملية» يكتب كل موظف على قصاصات ورق منفصلة أكبر 
ous‏ من الخصائص اطهمة التي egg‏ تحديدها. 
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بعد عدة دقائق» يكتب خلالها الموظفون آفکارهم» يطلب «جيم» من موظف متطوع 
قراءة إحدى أفكاره للمجموعة. تقول أليس Alice‏ إن إحدى الخصائص التي كتبتها كانت 
”مستعد لمشاركة الأفكار“. شكرها جيم وطلب منها أن تقوم بتعليق الورقة التي بها تلك 
الفكرة على الحائط. موظف آخرء يدعى Bill Jo‏ يقرأ so]‏ خصائصه: ”روح الدعابة“ 
وهيء أيضاً مسجلة على الحائط. تستمر هذه العملية مع قيام كل موظف على حدة بذكر 
كل الخصائص التي قام بتدوينها. وبهذه Ai hl‏ يحدد الموظفون بمفردهم مجموعة 
متنوعة من الخصائص التي يعتبرونها daga‏ بالنسبة لزملاء العمل. بعد القيام Uis‏ 
يقومون بلصق قصاصات الورق التي تحتوي على تلك الخصائص على الحائط. من بين تلك 
الخصائص المذكورة ما يلي: 
Uh‏ لديه الأدوات المناسبة للوظيفة. 
يعرف الكثر من Sant Saal‏ 


يعمل بروح الفريق. يجيد الأسلوب القصصي. 
شخص لديه عقيدة 


لديه خبرة كبيرة في هذا النوع من العمل. | لديه الاستعداد لساعات طويلة إذا 
استدعى الأمر ذلك. 


ل اول So‏ على كل اه 
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وتستمر هذه العملية لبعض الوقتء وسرعان ما تتم تغطية الجدار بأكثر من ٠١‏ ملصقة 
ورقية» كل منها تذكر سمة كان يعتقد الموظف أنها dago‏ ثم بعد GUS‏ يسأل جيم 
ا مشاركون أي الخصائص يرون أنه من ا ممكن ضمها مع بعضها البعض. تشير كاثرين إلى أن 
slong «Sd»‏ الذكاء» متشابهان. JEL‏ جيم الورقة التي كتبت Yule‏ كلمة ”ذي“ وينقلها 
إلى جانب كلمة ole”‏ الذكاء“. ويقترح فرانك أن الخاصية ”متعلم بشكل جيد“ يجب أن 
تكون Lay)‏ جزءًا من هذه المجموعة. وتتم إضافة العديد من الخصائص الأخرى إلى نفس 
مجموعة العبارات. ثم تلاحظ كارلا أن ”ودي“ و”يترك انطباعًا جيدًا لدى العملاء“ متشابهة 
مع بعضها البعض وتختلف عن المجموعة الأخرى من العبارات التي تم تشكيلها مسبقاً. إنها 
تقترح أن يتم تجميع هاتين الخاصيتين في مجموعة جديدةء ثم يضاف ”مرح“ أيضًا إلى هذه 
ا مجموعة الثانية. الخاصيتان ”متحفظ “ و”مهتم مظهره“ تشكلان نواة المجموعة الثالثة 
إلا أن إحدى الموظفات تعتقد أن ”متحفظ“ سيكون من الأفضل ضمها إلى ”يستعد للمهام“ 
بدلاً من ”مهتم بمظهره“. واستمرت هذه العملية حتى قام جيم والموظفون بتشكيل 
عدة مجموعات من الخصائص. تقريبًاء تم وضع كل خاصية موصوفة في مجموعة le‏ 

ثم يطلب جيم من المشاركين إعطاء أسماء -كلمة أو عبارة وصفية قصيرة-- لكل مجموعة 
من العبارات. مجموعات العبارات المختلفة هذه أعطيت مسميات مثل ”الذكاء"». ”المظهر“ 
ss)!”‏ ”الشخصية“ ”الاعتمادية“» وغيرها من المسميات الأخرى. افتراضياً كل مجموعة 
من العبارات تمثل مفهومًا رئيسيًا متعلقًا بتصورات الموظفين عن خصائص بعضهم البعض. 


مثال رقم ": 


بعد عدة سنوات» قررت الشركة تكرار التمرين. المدراء لديهم شك في أن الأمور قد 
تغيرت ها فيه الكفاية بحيث لا تظل كل الفئات المحددة سلفاً ذات صلة. جيم ميسر 
الأمهل للحصول على معلومات مماثلة قد تتمثل في تطوير استبيان يحتوي على بيانات مثل 
تلك التي توصل إليها الأشخاص في التمرين السابق. سيُطلب من الموظفين الإشارة إلى 
مدى أهمية كل cduol&‏ باستخدام العبارات Yo‏ على الإطلاق» و«إلى حد «le‏ و«جداً» 
كخيارات استجابة og‏ طبقت هذه الاستبانات على الموظفينء الذين بلغ عددهم OSI‏ 
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ما يقرب من ١٠٠١موظفاً.‏ وعندما جمعت كارول الاستبانات بعد تعبئتهاء اطلعت lde‏ 
لمعرفة الخصائص الأكثر أهمية. وكان أحد الأشياء التي لاحظتها هو أن هناك خصائص 
مختلفة مهمة لموظفين مختلفين. ولكن هناك بعض الخصائص المحددة صنفت بشكل 
مشابه مع بعضها البعض. على سبيل JEL‏ الأشخاص الذين اعتقدوا أن الخاصية ”يهتم 
بالتفاصيل“ كانت Aago‏ كان من المحتمل أن يعتقدوا أن الخاصية ”يستعد للمهام“ مهمة 
أيضاً والأشخاص الذين لا يعتبرون sol‏ هذه العناصر مهمة bale‏ لا يعتبرون الأخرى مهمة 
أيضاً. بحثت كارول في سبل للاستفادة أكثر من كومة الاستبانات وفكرت في كيفية فهمها. 
تذكرت كيف أنه خلال التمرين الأصلي الذي أجري قبل عدة سنوات باستخدام قصاصات 
الورق على tailed!‏ ظهر أن هناك مجموعات أكثر مما هو مطلوب بالفعل. اعتقدت كارول 
أن بعض العبارات الفردية لا قيمة لها إلى حد cle‏ وأحيانًا إذا كان لدى الشخص نفسه أكثر 
من واحدة من هذه العبارات التي لا قيمة لهاء فإن فئة كاملة لا قيمة لها ستنتج. وتساءلت 
عما إذا كانت هناك طريقة لتحديد عدد الفئات التي سيستغرقها تنقيح معظم ما يعتقده 
الموظفون بشأن زملائهم في العمل. وكتمرين» حاولت البحث عن مجموعات أخرى من 
العناصر (الخصائص). مثل تلك الاثنتين اللتين لاحظتهما سابقاً والتي تميل لأن تكون متماثلة 
عند الموظفين. بشكل رئيسي» بحثت كارول عن مجموعات من العناصر المتشابهة لا تستند 
فقط إلى محتواها ولكن إلى مدى تقييم الموظفين لها أيضاً. استغرق هذا Wo‏ كبيرا. وم تكن 
كارول متأكدة بالفعل من أنها حصلت على كل مجموعات العبارات dogh!‏ لكنها شعرت 
أنها قادرة على جمع بعض الأفكار المثيرة للاهتمام بهذه الطريقة من الاستبانات. 


أوجه القصور في هذه الطرق: 

كلا هذين امثالين يشبهان من الناحية النظرية التحليل العاملي ولكن مع بعض 
الاختلافات الهامة. في WS‏ الحالتين» النتيجة هي Sole)‏ تنظيم كمية كبيرة من المعلومات 
المحددة في مجموعة أكثر ALB‏ للإدارة من SUS‏ أكثر عمومية ولكن GIS‏ معنى. افتراضياً 
كل من عمليات إعادة التصنيف في فئات قد نتج عنها عدد قليل من الأفكار التي اكتسبت 
الكثير مما غطته العبارات الفردية العديدة. ومع US‏ كان لكلا النهجين أوجه قصور 
واضحة إلى حد ما. في المثال الأول كانت هناك سيطرة بسيطة على جودة البيانات الناتجة. 
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هذا القصور ينبع من حقيقة أن الأشخاص الذين يطورون البنود يختلفون في مستوى 
مهاراتهم في تكوين الأفكار ذات الصلة في عبارات موجزة. بعض الأشخاص منفتحون أكثر 
من غيرهم وقد ينتهي بهم ا مطاف إلى توليد المزيد من العبارات؛ ومع US‏ فليس الحال 
Ll‏ أن يكون أعضاء المجموعة الأكثر انفتاحاً هم الأكثر بصيرة. ولهذه الأسباب وغيرهاء 
تؤدي هذه العملية غالبًا إلى عبارات غامضة أو غير ذات صلة أو سخيفة. ولذا قد يكون من 
الصعب إزالة البنود ضعيفة الصياغة أو تحسينها. اعتمادًا على مرونة المجموعة المشاركة 
في التمرين» قد يكون من غير المناسب رفض هذه العبارات دون مجادلة مؤلفيها. ونتيجة 
IU‏ يتم منحهم مصداقية أكبر بقدر العبارات الأفضل التي تعكس المزيد من الأفكار 
المهمة. على الرغم من التفاوت في الجودة من بند إلى آخرء إلا أنه قد يتم التعامل مع 
الجميع بشكل متساو يزيد أو ينقص. 

إذا تم تقديم العديد من البنود السخيفة ولكنها متشابهة» فمن المحتمل أن تشكل فئة 
تستند فقط إلى تشابهها. رها يتم ترتيب الفئات حسب الأولويةء ولكن يتم ذلك Bole‏ 
بتوافق الآراءء واعتمادًا على من قام بإعداد العبارات» قد يكون هناك إحجام عن وصف 
بعض الفئات بأنها تافهة. ögle‏ على US‏ تشير تجربتي مع هذا النوع من التمارين إلى 
وجود ميل قوي لوضع كل عبارة في فئة معينة. يبدو أن وجود العديد من الفئات الواضحة 
ومن ثم وجود عبارة واحدة أو اثنتين يتامى لا تنتمي لأي من الفئات يجعل الأشخاص لا 
يوقفون عملية التصنيف حتى يتم توزيع تلك العبارات على الفئات» حتى وإن كان التوزيع 
في لحظتها غير ملائم. علاوة على WS‏ حتى عندما Ge‏ لشخص ما تحديد أي عبارات 
محددة تجسد فئة cle‏ فليس من الواضح بالضرورة تحديد أيها أفضل أو أسوأً. 

لذلك؛ كيف كان أداء هذا الأسلوب Sio‏ عام بالنسبة إلى وظائف التحليل العاملي 
المحددة سابقاً؟ من الواضح أن هذه الطريقة جعلت من الصعب تحديد البنود GIS‏ الأداء 
الأفضل أو الأسوأ. تتعارض مراقبة جودة البنود مع الطبيعة الجماعية لهذه المهمة وقد تخاطر 
بالإإساءة إلى بعض المشاركين. وعلى الرغم من أن الطريقة الموصوفة للتو لها بعض الفائدة 
في تحديد عدد المتغيرات الكامنة التي تستند إليها العبارات التي قام الموظفون بإنشائها. مع 
إسناد هذا التحديد إلى الانطباعات الذاتية للموظفين» كما هو الحال» يبدو أقل من JEL!‏ 
على الرغم من أن الموظفين قد يكون لديهم رؤى قيمة في مكان عملهم» فمن غير المرجح 


yyy‏ تطوير المقاييس: النظرية والتطبيق 


التحليل العاملي 


أن يكون لديهم خبرة في تنظيم هذه الأفكار إلى مجموعات متماسكة تمثل مفاهيم بنائية 
195 مهمة. علاوة على WS‏ هناك القليل من الأساس الموضوعي لتحديد ما إذا 
كان الموظفون كمجموعة قد قاموا بعمل جيد أو سيء لتحديد عدد المتغيرات الكامنة 
وراء العبارات المنشأة, OY‏ العملية تعتمد فقط على معايير ذاتية. وفيما يتعلق بتجميع 
المعلومات. تظهر مشكلة مماثلة. على الرغم من أنه قد يتم تجاهل بعض البنود gl)‏ حتى 
الفئات بأكملها)» إلا أن المعايير المستخدمة هي بالضرورة ذاتية ولا توجد Gow‏ وسائل قليلة 
للحكم بشكل موضوعي على ما إذا كانت الخيارات الجيدة قد اتخذت. الاعتبار الوحيد 
الذي قد لا تؤديه هذه الطريقة بشكل سيء للغاية هو تعريف ال محتوى الموضوعي أو معنى 
العوامل. إذا كانت العوامل IS‏ مصداقية (وهي مفتوحة (Ug ul)‏ فإن فحص محتوى 
العبارات المقدمة قد يعطي نظرة ثاقبة في ال مفاهيم البنائية الأساسية التي كان الموظفون 
يدركون أهميتها. 

المثال الثاني تجنب بعض أوجه القصور هذه. يمكن لكارول التخلص من البنود التي 
لا ترى مناسبتها لكونها غير ذات dbo‏ على الرغم من أن هذا يضيف tas‏ كبيراً على حكمها. 
على الأقل كانت عملية تأييد البنود أكثر دهقراطية إلى حد ما. على كل شخص أن يقيم 
كل بند دون التعرض لخطر استبعاد زميل العمل. وبالتالي» GB‏ عملية تحديد البنود ذات 
الأداء الأفضل أو الأسوأ Ley‏ كانت على الأقل أكثر اتسافًا. علاوة على HS‏ لم يتم تحديد 
ا مجموعات من خلال مجرد شعور بالتشابه الواضح في العبارات ولكن عن طريق الأدلة على 
أن الناس تفاعلوا مع البنود التي تم تصنيفها في مجموعات متشابهة بطريقة مشتركة. أي 
إن التشابه كان سمة البنود (مجموعات معينة من التي تبدو أنها تثير تصورات مماثلة)» 
وليس ا مستجيبون (الذين تباينوا في استجاباتهم على أي بند محدد). رؤية بند واحد في 
مجموعة على أنه غير مهم يعني أنه من المحتمل بشكل كبير لنفس الفرد رؤية البنود 
الأخرى في نفس المجموعة على أنها غير مهمة. قد يرى موظف آخر أن هذه البنود نفسها 
مهمة بشكل متسق. المسألة الحاسمة هي أنه. بغض النظر عن تقييم الفرد للأهميةء هناك 
ميل OY‏ تكون متسقة خلال العبارات داخل ا مجموعة. في الواقع. كان هذا هو الأساس 
الذي شكلت عليه كارول ال مجموعات. وبالتاليء رها قد تم تحسين عملية تحديد عدد 
المتغيرات الكامنة إلى حد ما من خلال اعتماد هذه المنهجية المنقحة القائمة على الاستبيان. 


تطوير المقاييس: النظرية والتطبيق 1۷ 


الفصل السادس 


بطبيعة led!‏ فإن تقييم البنود عن طريق الفحص البصري ل ١6١‏ استبيانًا سيكون Fel‏ 
BLS‏ إلى حد oS‏ ومن ا محتمل أن نظام التصنيف لكارول لم يكن أكثر الطرق ا ممكنة 
كفاءة. ومن الأسئلة التي تثار: ما مدى الاتساق المطلوب للبنود لاعتبارها مجموعة؟ كم 
عدد حالات قيام موظف واحد بإعطاء تقييمات متباينة gl)‏ اتفاق واختلاف في الأهمية) 
لبندين في نفس المجموعة المحتملة هكن أن تقبلها كارول؟ من الصعب القول إلى أي مدى 
تكون هذه الطريقة قد حققت الوظائف الطمتبقية - تركيز ا معلومات وتحديد المحتوى 
الموضوعي أو معنى العوامل. يعتمد كلاهما على مدى جودة العمل الذي كانت كارول 
قادرة على القيام به لإيجاد واستبعاد البنود الضعيفة» والتحديد بشكل صحيح ال موضوعات 
dagh!‏ ومن ثم استخدام البنود داخل المجموعات لتفسير المفاهيم البنائية ا محتملة. 

باختصار من الواضح أن هاتين الطريقتين تتركان الكثير مما هو مرغوب فيه لو كان 
الهدف هو تحقيق الوظائف المذكورة أعلاه والتي ترتبط dale‏ بالتحليل العاملي. وللإنصاف. 
قدلا يكون الهدف من المنهجيات ال موصوفة (خاصة الأولى) تحقيق تلك الوظائف» ولكن 
يبدو أن بعض الأهداف المماثلة لما ينجزه التحليل العاملي تحفز القيام ممارسات Jis‏ 
التمرين الأول الذي تم وصفه سابقاً. في حين أنه تم القبول بهذه الحجة. فإن تمرين 
الموظف بالمقارنة مع التحليل العاملي يخدم الأغراض: (I)‏ تقديم توضيح أكثر سهولة U‏ 
يمكن أن يحققه التحليل العاملي و(ب) تسليط الضوء على أوجه القصور المحتملة لنهج 
ذاتي وغير رسمي لتحديد المتغيرات الأساسية. 


الوصف المفاهيمي للتحليل العاملي: 

التحليل العاملي عبارة عن did‏ من الإجراءات التي تنجز نفس النوع من التصنيف 
مثل الأساليب المذكورة أعلاه ولكنها تفعل ذلك dg‏ لمجموعة من العمليات ASV)‏ تنظيماً 
وتوفر معلومات أكثر وضوحًا هكن لمحلل البيانات استخدامها في إصدار الأحكام. وكالطرق 
الموصوفة آنفاً يحدد التحليل العاملي فئات من العبارات المتماثلة. تتمثل المهمة الأولى 
للمحلل في تحديد عدد الفئات التي تكفي لالتقاط الجزء الأكبر من المعلومات الموجودة في 
مجموعة العبارات الأصلية. 
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التحليل العاملي 


استخلاص العوامل: 


يمكن للشخص أن ينظر إلى التحليل العاملي كبداية على افتراض أن فئة واحدة كبيرة 
تحتوي على جميع البنود هو كل ال مطلوب ize)‏ أن مفهوم أو فئة واحدة تكفي للأخذ في 
الاعتبار hé‏ الاستجابات). Baie‏ يقوم بتقييم مقدار الارتباط بين البنود الفردية التي هكن 
أن يفسرها ذلك المفهوم الوحيد. يقوم التحليل بعد ذلك بإجراء فحص لمعرفة مدى نجاح 
فرضية المفهوم الوحيد. إذا ظهر أن مفهومًا أو did‏ واحدة لمم تقم بالعمل اللازم لحساب 
التغاير covariation‏ بين البنود فإن التحليل العاملي يرفض الفرضية اطبدئية. ثم يحدد 
المفهوم الثاني gl)‏ المتغير الكامن أو العامل) الذي يفسر بعض التغاير المتبقي بين البنود. 
تستمر هذه العملية إلى أن يكون مقدار التغاير الذي b‏ تفسره مجموعة العوامل صغيراً. 


العامل الأول: 

كيف يتم fus SEUS‏ العملية مصفوفة الارتباط لجميع البنود الفردية. باستخدام هذه 
المصفوفة كنقطة Alay‏ يقوم التحليل العاملي بفحص أنماط التغاير الممثلة بالارتباطات بين 
البنود. ما يلي هو وصف مفاهيمي» وتم حذف بعض التفاصيل الرياضية لمصلحة الوضوح» 
لذلك لا ينبغي أن يؤخذ ذلك Gya‏ حيث إنه فقط مجموعة العمليات التي تقوم عليها 
تحليلات العوامل المولدة بالحاسوب. 

كما LSS‏ سابقًاه تتضمن العملية الفرضية المبدئية للمفهوم الفردي الذي يمكن وبشكل 
كاف أن يأخذ بالاعتبار مط الارتباطات بين البنود. وهذا بمثابة تأكيد مؤقت على أن النموذج 
الذي يحتوي على متغير كامن واحد gl)‏ عامل (dels‏ مع وجود مسار منفصل ينبثق منه 
إلى كل بند من البنود» هو تمثيل دقيق للعلاقات السببية (انظر الشكل رقم .)١1-5‏ هذا 
يعني كذلك أن مثل هذا النموذج هكن أن يأخذ في الاعتبار الارتباطات بين البنود. لاختبار 
ناذا الافتراض من الناحية المفاهيمية. يجب أن يحدد برنامج التحليل العاملي العلاقة بين 
كل بند والعامل الذي ثل المتغير الكامن الفرديء ومن ثم النظر إلى ما إذا كان يمكن إعادة 
إنشاء الارتباطات المرصودة بين البنود عن طريق ضرب المسارات التي تربط كل زوج من 
المتغيرات عبر العامل. ولكن كيف هكن للبرنامج حساب الارتباطات بين استجابات البنود 
ا مرصودة والعامل الذي هثل متغير كامن مم يتم ملاحظته أو قياسه مباشرة؟ 


تطوير المقاييس: النظرية والتطبيق yia‏ 
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شكل :)١-1(‏ نموذج العامل الواحد 


أحد الأساليب هو افتراض أن مجموع جميع الاستجابات على البنود هو تقدير عددي 
معقول للمتغير الكامن الشامل الذي يُفترض أن يأخذ في الاعتبار الارتباطات بين البنود. 
وبشكل رئيسي» هذا المجموع الكلي هو تقدير «لدرجة» المتغير الكامن. ولأن الدرجات 
الفعلية لجميع البنود WOAH‏ في الوقت الحالي تحديدها من خلال متغير كامن واحدء فإن 
كمية المعلومات من جميع البنود gl)‏ المجموع AII‏ للمعلومات) هو تقدير معقول 
للقيمة العددية للمتغير الكامن. من السهل إلى حد ما إضافة درجات البنود Lee‏ إلى مجموع 
الدرجات وحساب ارتباطات البند - المجموع item-total correlations‏ لکل su‏ منفصل 
مع إجملي كل البنود. تعمل ارتباطات البند - المجموع كممثل للارتباطات بين البنود 
ا مرصودة وامتغير الكامن الغير مرصود gl)‏ المسارات السببية من المتغير الكامن إلى البنود). 
مع القيم المحددة لهذه المسارات السببية» هكن للشخص بعد ذلك حساب الارتباط بين 
البنود المتوقعة Ely‏ على نموذج العامل الواحد. تمثل هذه الارتباطات النموذجية إسقاطات 
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Gey Lt‏ أن تكون عليه الارتباطات الفعلية بين البنود إذا كانت فرضية المتغير الأساسي 
الوحيد صحيحة. كن تقييم شرعية الفرضية من خلال مقارنة الارتباطات المتوقعة مع 
الارتباطات الفعلية. هذا يعني طرح كل ارتباط متوقع من الارتباط الفعلي المقابل Eby‏ على 
البيانات الأصلية. يشير الفرق الكبير بين الارتباطات الفعلية والمتوقعة إلى أن نموذج العامل 
الواحد غير مناسب؛ ولا يزال هناك بعض التغاير بين البنود م يتم أخذه بالاعتبار. 


قد يساعد النظر في هذا التسلسل لزوج واحد من BoA og idl‏ التي تعد جزءًا من 
مجموعة أكبر. Voi‏ ستتم إضافة المجموعة الكاملة من البنود. ما في ذلك A‏ و8 Lee‏ 
للحصول على درجة ملخصة. ثم سيتم حساب الارتباطات بين A‏ والدرجة الإجمالية وبين B‏ 
والدرجة الإجمالية. يُفترض أن هذين الارتباطين بين البند والمجموع Ode AI‏ الارتباطات 
بين A‏ و8 والعاملء الذي يتوافق مع المتغير الكامن الأساسي. إذا كانت فرضية متغير كامن 
وحيد صحيحة» فسيكون لرسم تخطيطي للمسار يشتمل على Bg A‏ والعامل مسارات 
a)‏ وط في الشكل )١-1‏ من العامل إلى كل من البندين A‏ و8. ستكون قيم هذه المسارات 
هي الارتباطات بين البند وا مجموع الكلي ogi‏ الموصوفة للتو. Sly‏ على مخطط المسار 
هذاء يجب أن يكون الارتباط بين A‏ و8 هي حاصل ضرب هذين المسارين. حساب هذا 
الارتباط المقترح بين A‏ و8 يتضمن الضرب البسيط. 





:(Y-1) JSS‏ نموذج مبسط لعامل واحد يتضمن بندين فقط 


مجرد حسابه» ممكن مقارنة الارتباط المقترح مع الارتباط الفعلي بين A‏ و8. ممكن طرح 
الارتباط المقترح من الارتباط الفعلي للحصول على الارتباط المتبقي. قد يشير الارتباط المتبقي 
الكبير إلى أن الادعاء بأن متغير كامن وحيد هو السبب الوحيد ple‏ بين A‏ و8 غير كاف. 


تطوير المقاييس: النظرية والتطبيق تقرف 


الفصل السادس 


العمليات التي تتم على مصفوفة الارتباط بأكملها في وقت واحد تقوم بالإجراء المذكور 
سابقاً لكل زوج ممكن من البنود. وبدلاً من الانتهاء إلى ارتباط متبق dels‏ يتم حساب 
مصفوفة كاملة من الارتباطات المتبقية (تسمى: مصفوفة البقايا (residual matrix‏ 
بحي ث هثل كل ارتباط متبق مقدار التغاير بين زوج معين من البنود ال موجودة فوق وما 
بعد التغاير الذي مكن ممتغير كامن واحد أن يفسره. 


العوامل اللاحقة: 


أصبح من الممكن الآن العمل على مصفوفة البقايا هذه بنفس الطريقة التي عولجت 
بها مصفوفة الارتباط dod!‏ واستخراج عامل GG‏ مقابل متغير كامن جديد. مرةً أخرى 
هكن حساب الارتباطات بين البنود والمتغير الكامن الثاني (العامل ۲ في الشكل رقم (Y-A‏ 
tus‏ على تلك الارتباطات» بمكن إنشاء مصفوفة الارتباطات المقترحة. 














شكل (5-): نموذج بعاملين 
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تمثل هذه الارتباطات المقترحة مدى الارتباط الذي يجب أن يبقى بين البنود بعد أخذ 
العامل الثاني في الاعتبار. إذا استحوذ العامل الثاني على كل التغاير المتبقي بعد استخراج 
العامل oil‏ فينبغي أن تكون هذه القيم المتوقعة مماثلة للقيم التي كانت موجودة في 
مصفوفة البقايا ا مذكورة أعلاه. إذا م يكن الأمر كذلك. فقد تكون هناك dele‏ إلى مزيد 
من العوامل لحساب التغاير المتبقي الذي م يُنسب بعد إلى أحد العوامل. 


يمكن أن تستمر هذه dal‏ مع كل عامل جديد مستخرج من مصفوفة البقايا التي 
نتجت عن التكرار السابقء حتى يتم تحقيق مصفوفة تحتوي فقط على علاقات متبادلة 
صغيرة مقبولة. عند هذه النقطةء يمكن للشخص أن يتخذ قراراً أنه قد تم حساب جميع 
التغايرات المهمة بشكل أساسي وأنه لا توجد dolge‏ أخرى مطلوبة. من الممكن متابعة 
العملية حتى يتم الحصول على مصفوفة بقايا تتكون بالكامل من الأصفار. وهذا سيحدث 
عندما يكون عدد العوامل ا مستخرجة يساوي عدد البنود في التحليل العاملي. وبمعنى آخرء 
{Sate‏ :دافا Gyo degame‏ العواهل k‏ من تفم كل التغاير نن de game‏ مق Kk sgl‏ 


تحديد عدد العوامل التى يجب استخلاصها: 


يمكن أن يكون تحديد عدد العوامل التي يمكن استخراجها مشكلة معقدة (على سبيل 
(Zwick & Velicer, 1986 JILI‏ وبطبيعة الحال» فإن الدافع الرئيسي لإجراء التحليل 
العاملي هو الانتقال من مجموعة كبيرة من المتغيرات (البنود) إلى مجموعة أصغر (العوامل) 
تقوم بعمل معقول لالتقاط المعلومات الأصلية gl)‏ تركيز المعلومات). ويمكن تحديد 
”العمل المعقول“ بعدة طرق. 

بعض الأساليب التحليلية للعوامل تستخدم معياراً إحصائياً مثل تلك القائمة على التقدير 
بأسلوب الاحتمال الأعظم والتحليل العاملي التوكيدي (والذي ستتم مناقشته (ÉY‏ القائم 
على طريقة نمذجة المعادلات البنائية. في هذا السياق» يشير مصطلح المعيار الإحصائي إلى 
حقيقة أن الأساليب الاستدلالية تستخدم لتحديد ما إذا كان احتمال وجود نتيجة معينة 
ضئيلًا بدرجة كافية لاستبعاد حدوثها بالصدفة. هذا يعني إجراء اختبار لمعرفة ما إذا كانت 
البقايا المتبقية تحتوي على مقدار من التغاير تكون إحصائياً أكبر من الصفر وذلك بعد 
استخراج كل عامل لاحق. إذا كان هذا هو lod!‏ تستمر العملية حتى م يعد الأمر كذلك. 
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إن الاعتماد على معيار Glas]‏ بدلاً من الحكم الشخصي هو سمة جذابة لهذه الأساليب. 
ومع ذلك في تطوير المقاييس, قد لا يتوافق هذا مع الهدف eg bab)‏ والذي يتمثل في تحديد 
مجموعة صغيرة من العوامل التي يمكن أن تفسر التغاير المهم بين البنود. تسعى الأساليب 
الإحصائية إلى الحصول على تحديد شامل للعوامل الكامنة وراء مجموعة من البنود. إذا 
كان هناك بعض مصادر التغاير لم يتم حسابها من قبل أي من العوامل ا مستخرجة بعد. فإن 
مثل هذه الأساليب تستمر في استخراج المزيد من العوامل. وما يسعى إليه مطور LAL!‏ 
في كثير من الأحيان بعد ذلك هو الاختزال في عدد العوامل. أي إنه في سياق تطوير اممقياس» 
غالبًا ما نريد معرفة مصادر الاختلاف القليلة والأكثر نفوذاً التي تقوم عليها مجموعة من 
البنود. وليس كل مصدر ممكن هكننا اكتشافه. عند تطوير المقياسء يقوم المرء Sole‏ بإنشاء 
قائمة طويلة من البنود أكثر من المتوقع للوصول إلى الأداة النهائية. والبنود التي لا تساهم 
في العوامل الرئيسية المحددة قد يتم حذفها في نهاية المطاف. هدفنا هو تحديد عدد قليل 
نسبياً من البنود التي ترتبط بقوة بعدد صغير من المتغيرات الكامنة. وعلى الرغم من أن 
محلل البيانات الماهر يمكنه تحقيق هذا الهدف من خلال الأساليب التحليلية للعوامل 
باستخدام معيار إحصايء إلا أن الباحث الأقل خبرة: ومن BLAM‏ قد يكون أفضل من 
خلال استخدام إرشادات أخرى أكثر ذاتية ولكن من المحتمل أن تكون أقل غموضاً. 

هذه الإرشادات الذاتية تعتمد Gus‏ على نسبة التباين الكلي بين البنود الأصلية التي 
يمكن لمجموعة من العوامل شرحها. وهذا هو الأساس نفسه الذي تستخدمه الأساليب 
الإحصائية. بينما في حالة المعايير غير الإحصائية (معنىء لا تستند إلى الاحتمالية)» 
يقوم محلل البيانات بتقييم مقدار المعلومات التي يحتوي عليها كل عامل JE‏ ويتخذ 
القرار حيال ذلك متى ما تم الوصول إلى نقطة تناقص النتائج. يشبه هذا تقريبًا تفسير 
الارتباطات (مثل معاملات (GLU!‏ على أساس حجمهاء معيار ld‏ وليس على أساس قيمتها 
الاحتمالية p‏ كمعيار إحصائي. اثنان من المبادئ التوجيهية غير الإحصائية المستخدمة على 
نطاق واسع للحكم عند استخراج عوامل كافية هي قاعدة الجذور الكامنة eigenvalue‏ 
(Kaiser, 1960)‏ واختبار الحصاة (Cattell, 1966) scree test‏ 

يمثل الجذر الكامن (القيمة الكامنة) eigenvalue‏ مقدار المعلومات التي تم التقاطها 
بواسطة العامل. بالنسبة لأنواع معينة من طرق تحليل العوامل (مثل تحليل المكونات 
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الرئيسية principal component analysis‏ والتي ستتم مناقشته oY‏ في هذا (ass!‏ 
فإن إجمالي كمية ا معلومات في مجموعة من البنود يساوي ous‏ البنود. وبالتالي» في تحليل 
Jus 0‏ سيكون هناك YO‏ وحدة من ال معلومات. الجذر الكامن لكل عامل يتوافق مع جزء 
من هذه الوحدات. على سبيل JEL‏ في حالة تحليل مكون من Jus YO‏ فإن العامل ذا 
الجذر الكامن Jig ٥,۰‏ ۲۰> (۲۰/۵) من إجمالي ا معلومات؛ جذر كامن آخر laie‏ ۲,۵ تمثل 
٠‏ من إجمالي المعلومات, وهلم جراً. نتيجة لهذه العلاقة بين كيفية قياس المعلومات 
وعدد البنود في التحليل هي أن الجذر الكامن بقيمة ٠,١‏ يقابل >1 / 1 من التباين الكلي 
بين مجموعة من البنود. وبعبارة أخرىء فإن العامل (بافتراض تحليل المكونات الرئيسية) 
الذي يحقق جذر كامن تساوي 2٠١‏ يحتوي على نفس النسبة من إجمالي المعلومات كما هو 
الحال في البند الفردي العادي. Lab‏ إذا كان الهدف من التحليل العاملي هو الوصول 
إلى عدد أقل من المتغيرات التي تلتقط بشكل كبير المعلومات الواردة في مجموعة المتغيرات 
الأصلية» فإن العوامل يجب أن تكون محملة با معلومات JST‏ من البنود الأصلية. وفقًا 
لذلكء تؤكد قاعدة الجذر الكامن )1960 (Kaiser,‏ أنه لا ينبغي الاحتفاظ بالعوامل ذات 
الجذور الكامنة التي أقل من ٠,١‏ (وبالتالي» تحتوي على معلومات أقل من البند المتوسط). 
على الرغم من أن الأساس المنطقي لاستبعاد هذه العوامل أمر منطقي» فماذا عن العوامل 
التي تزيد SUB‏ عن ١١؟‏ هل العامل الذي يفسر معلومات JST‏ بنسبة >١‏ من البند العادي 
lie‏ يقدم نوعًا من المعلومات المركزة التي نلاحقها؟ في كثير من OLE‏ تكون الإجابة ”لا“ 
مما يوحي بأن قاعدة الجذور الكامنة قد تكون سخية للغاية كأساس للاحتفاظ بالعوامل. 
أعتقد أن هذا هو الحال عمومًا في تطوير المقياس استنادًا إلى الأساليب الكلاسيكية. 
ويستند اختبار الحصةة (Cattell, 1966) scree test‏ أيضاً على الجذور الكامنة ولكن 
يستخدم قيمها النسبية بدلاً من قيمها المطلقة كمعيار. ويستند إلى الرسم البياني للجذور 
الكامنة ال مرتبطة بالعوامل المتعاقبة. ونظرًا GY‏ كل عاملء بعد العامل الأول» يتم استخلاصه 
من مصفوفة تمثل البقايا residuals‏ الناتجة من استخراج العامل السابق (كما هو موضح 
سابقًا)» فإن كمية المعلومات في كل عامل JE‏ تكون أقل من سابقاتها. اقترح كاتيل Cattell‏ 
أنه يمكن تحديد العدد ”الصحيح“ من العوامل من خلال النظر في انخفاض كمية ال معلومات 
(وبالتالي» في حجم الجذر الكامن) عبر العوامل المتعاقبة. عند رسم هذه ال معلومات. سيكون 
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لها شكل يتسم بجزء عمودي في الغالب على اليسار (يمثل الجذور الكامنة الكبيرة) ينتقل 
إلى جزء أفقي نسبيًا على اليمين (مطابق للجذور الكامنة الصغيرة). واعتبر LSS‏ العوامل 
المرتبطة بالجانب الأيمن التي تمثل الجزء الأفقي من الرسم البياني مستهلكة لا dele‏ لها 
في المصطلحات dole!)‏ الحصاة تصف الركام الذي يتجمع على الأرض بعد الانهيار الأرضي. 
يعني هذا المصطلح, إذن» أن الجزء الرأسي من الرسم البياني هو المكان الذي توجد فيه 
العوامل الجوهرية بينما الجزء الأفقي هو الحصاة» أو الركام» التي يجب التخلص منها. من 
الناحية AVL‏ سيكون لتقدم العوامل نقطة تسقط lous‏ المعلومات Sled‏ مع انتقال 
مفاجئ من رأسي إلى أفقي و”مرفق “elbow‏ واضح (انظر الشكل (E-I‏ يدعو معيار 
J] Cattell‏ الإبقاء على تلك العوامل الكامنة فوق المرفق من الرسم البياني. في بعض 
hod!‏ لا يكون الانتقال مفاجنًا لكنه تدريجي (انظر الشكل رقم 0-1( مع وجود منحنى 
خفيف يتكون من عدة عوامل تقع بين SLL!‏ الرأسية والأفقية للرسم البياني. في مثل هذه 
الحالات» قد يكون تطبيق اختبار الحصاة ل Kol Cattell‏ خادعًا ويتطلب اعتمادًا ST‏ على 
معايير ذاتية» مثل قابلية التفسير للعامل. يعتبر العامل SUB‏ للتفسير إلى الحد الذي تبدو 
فيه البنود المرتبطة به متشابهة مع بعضها البعض وتجعلها ذات معنى من الناحية النظرية 
ومنطقية كمؤشرات للفهوم بنائي متماسك. 
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شكل )1-€(: owy‏ الحصاة scree plot‏ يتضمن مرفق elbow‏ واضح 
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يوجد معيار إحصاني آخر. له شعبية متزايدة, يعتمد على التحليل الموازي 
jc) parallel analysis‏ سبيل .(Hayton, Allen, & Scarpello, 2004 «Jll‏ المنطق 
خلف هذا النهج هو أن حجم الجذر الكامن للعامل الأخير hidl‏ به يجب أن يتجاوز 
الجذر الكامن الذي تم الحصول عليه من بيانات عشوائية في ظل ظروف مماثلة. بمعنى 
آخر» في دراسة حقيقية تتضمن التحليل العاملي» قل ٠١ Iio‏ متغيرًاً Line‏ على 06٠١‏ 
شخصء يجب أن يكون الجذر الكامن لأي عامل مُحتفّظ به أكبر من الجذر الكامن المقابل 
الذي تم الحصول عليه من بيانات تم إنشاؤها عشوائيًا 45,2 لتمثيل ٠١‏ متغيرًا تم قياسها 
على ٥٠١‏ شخص. تقوم برمجيات التحليل ا موازيء» والتي تتوفر على الإنترنت كوحدات 
ماكرو مطورة بواسطة ال مستخدم لمجموعة متنوعة من الحزم الإحصائية: بإنشاء عدد كبير 
من التوزيعات تتوافق مع حجم مجموعة البيانات الفعلية. 


3 
3 
3 





شكل )0-1(: owy‏ الحصاة scree plot‏ لا يتضمن مرفق elbow‏ واضح 


وبالتالي» في هذا JEL‏ سوف تولد الخوارزمية الكثير (مكن للمستخدم Sole‏ تحديد 
العدد؛ ١٠٠٠غالباً‏ العدد الافتراضي) من مجموعات البيانات العشوائية المكونة من ٠١‏ متغيراً 
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و٠٠‏ شخص. يتم استخراج أو استخلاص الجذور الكامنة لكل Äe gara‏ من مجموعات 
البيانات المولدةء ويتم إنشاء توزيع الجذور الكامنة ضمن البرنامج للعامل الأول والعامل 
«SWI‏ وهكذا تستمر العملية لبقية العوامل. لكل من هذه التوزيعات» يتم تحديد قيمة 
ممثلة (على سبيل JGL‏ الوسيط). يتم عرض ا مخرجات الرسومية» كما هو مبين في الشكل 
رقم (1-5). يحتوي هذا الشكل على خطين يربطان النقاط المتعلقة بالجذور الكامنة 
للعوامل المتتالية. الخط المستقيم تقريباً المتدرج تنازلياً من اليسار إلى اليمين هثل وسيط 
الجذور الكامنة (عبر مجموعات البيانات العديدة المولدة بالحاسوب) للبيانات العشوائية 
التي لا ترتبط المتغيرات فيها بالعوامل الأساسية السائدة. الخط الآخر في الشكل هو رسم 
الحصاة الفعليء استنادًا إلى البيانات الحقيقية محل الاهتمام. ويشار إلى عدد العوامل 
التي يجب الاحتفاظ بها من خلال تقاطع خطي البيانات الفعلية والعشوائية (المولدة). 
حجم الجذور الكامنة التي تقع فوق الخط الذي هثل البيانات العشوائية أكبر من المتوقع 
بالصدفة بمفردها (أي إنها ذات دلالة إحصائية). وتلك القيم التي تقع أسفل خط البيانات 
العشوائية ليست معنوية We)‏ سبيل Slit]‏ يمكن توقع حدوثهم بالصدفة البحتة). 





























شكل (1-1): شكل بياني من التحليل الموازي يوضح حجم الجذور الكامنة للعوامل امتتالية من 
البيانات المولدة (المحاكاة) والبيانات الفعلية 
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في المثال الموضح في الشكل المصاحب» حقق العاملان الأولان من البيانات الفعلية قيمًا 
ذاتية أكبر من تلك للعاملين المقابلين استناداً إلى البيانات المولدة بشكل عشوائي. وبالتالي» 
فإن هذين العاملين الأولين فقط يفيان بمعايير الاستبقاء. لاحظ أن البيانات العشوائية 
المولدة تسفر عن عدد من العوامل بجذور كامنة أكبر من ٠,١‏ مما يدل على عدم كفاية 
قاعدة الجذور الكامنة. يُظهر فحص خط البيانات الحقيقية أنه سيتم أيضًا الاحتفاظ 
gle‏ استنادًا إلى معيار اختبار الحصاة الذي يبقي على العوامل الواقعة فوق نقطة 
”المرفق“ (التي تتوافق مع العامل الثالث) من الرسم البياني. ولأن وحدات الماكرو (برمجيات 
حاسوبية) لإجراء التحليل ال موازي في مختلف الحزم الإحصائية (بما في ذلك SAS‏ و5255) 
جاهزة ومتاحة عبر الإنترنت دون قيود على استخدامها ودون مقابلء فإن تطبيق هذه 
الطريقة كوسيلة لاختيار عدد العوامل التي يجب الاحتفاظ بها أصبح ممارسة شائعة. 
ومن خلال تجربتي» فإن التوجيه الذي تقدمه هذه الطريقة يتماشى مع الأحكام التي يتم 
إصدارها Zk;‏ على معايير ذاتية مثل رسم الحصاة. ومع WS‏ فإن لها ميزة كونها ترتكز على 
معيار إحصائي» وبالتالي فهي تتمتع بقبول أوسع من الأساليب الذاتية. وفقًا لذلك» أوصي 
باستخدام التحليل الموازي كأساس جوهري لتحديد عدد البنود التي يجب استخراجها. 

تجدر الإشارة إلى أنه تم تطوير التحليل الموازي لأول مرة للاستخدام مع المكونات 
الرئيسية بدلاً من العوامل المشتركة. وستتم مقارنة هذه الأساليب التحليلية المختلفة 
للعوامل لاحقاً. Lule‏ نلاحظ فقط أنه بينما يتم حساب المكونات الرئيسية من 
مصفوفة الارتباط Ae!‏ يتم حساب العوامل المشتركة من مصفوفة ارتباط مخفضة 
reduced correlation matrix‏ تحتوي على تقديرات تم ضبطها لإزالة تباين الخطاً من 
ا متغيرات. تم توسيع التحليل ال موازي لاستخدامه مع العوامل المشتركة. ولكن كما Bey‏ 
Lorenzo-Seva )2011(١(‏ فإن ous‏ الجذور الكامنة للبيانات الحقيقية 
التي تتجاوز تلك الخاصة بالبيانات العشوائية هيل إلى أن يكون أكبر في حالة العوامل 
المشتركة منها في حالة المكونات الرئيسية. المنطق shg‏ التحليل الموازي تم تطويره مع وضع 
المكونات في الاعتبار. وبالتالي» في بعض الحالات» فإن عدد العوامل التي يسفر عنها التحليل 
الموازي التي ينبغي الاحتفاظ بها من العوامل المشتركة قد يكون تقديرًا مبالغًا فيه للأبعاد 
الحقيقية لمجموعة البيانات. 
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قد تظهر هناك مواقف Louis‏ تدعم اعتباراتٌ جوهرية (مثل قابلية تفسير العوامل 
الناتجة) الاحتفاظ بالمزيد أو أقل من العوامل باستخدام طريقة مثل التحليل المتوازي. 
عندما يحدث هذا نقترح تقديم نتائج الطريقة ا مستخدمة Vol‏ (على سبيل JELI‏ التحليل 
الموازي) مع الأساس المنطقي لاتخاذ القرار للابتعاد عن التوجيه الذي توفره هذه الطريقة. 
وإذا كانت المسائل الجوهرية مقنعة. فقد تكون هناك بعض الصعوبة في إقناع القراء 
والمراجعين بأنه قد تم التوصل إلى قرار مناسب. من ناحية أخرىء إذا كانت الحجج التي 
تم تنظيمها bes‏ لتجاهل النتائج الأولية ليست مقنعة: فقد لا يكون هناك ما يبرر رفض 
هذه النتائج. 


تدوير العوامل: 

الغرض من استخلاص العوامل هو بكل بساطة تحديد العدد ا مناسب من العوامل التي 
يجب فحصها. إن وضع المعلومات في التكوين أو الشكل الأكثر فهماً ليس هو الهدف من 
استخلاص العوامل. العوامل الخام الغير مدارة unrotated‏ هي تجريدات رياضية لا معنى 
لها. وكقياس تقريبيء تخيل أنه قد lb‏ منك وصف طول جميع الأشخاص في الغرفة. 
وقررت أن تفعل ذلك عن طريق اختيار شخص بشكل اعتباطي» حيث تم اختيار جو بشكل 
عشوائي» وقياس dob‏ ووصف أي شخص آخر Gb‏ أطول أو pai‏ من الشخص المرجعي» 
ogo‏ بعدة بوصات. لذلك؛ قد يكون أحد الأشخاص Jabi‏ من جو بثلاث بوصات وآخر أقصر 
dio‏ مقدار بوصتين. في مثل هذه الحالة» جميع المعلومات حول الأطوال متوفرة بعدة 
طرق تقدهية للبيانات ولكن مم يتم تنظيمها بالطريقة SV!‏ إفادة. سيكون من الأسهل 
على الناس تفسير البيانات إذا تم تحويلها إلى نموذج يمكن dogs‏ بسهولة. مثل طول كل فرد 
في الغرفة, معبراً عنه بالأقدام والبوصات. يشبه دوران العوامل التحول من حيث إنه يقدم 
البيانات المتاحة مسبقاً بطريقة أسهل للفهم. 

قبل محاولة تفسير العوامل - للتأكد من ال مفاهيم البنائية أو المتغيرات الكامنة المقابلة 
للعوامل» على أساس البنود التي تم تحديدها مع كل عامل - bale‏ ما يكون من الضروري 
إجراء تدوير للعوامل. يزيد دوران العوامل من قابلية التفسير من خلال تحديد مجموعات 
ا متغيرات التي يمكن وصفها في الغالب بمتغير كامن واحد asi)‏ البنود المتشابهة من حيث 
۰ تطوير المقاييس: النظرية والتطبيق 
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إنها we‏ لها علاقة قوية مع بعضها البعض, وبالتالي يتم تحديدها إلى حد nS‏ بعامل 
واحد فقط). إن تدوير العوامل وقابلية التفسير الأفضل الناتجة عنه لا تتم بتغيير البنود أو 
العلاقات فيما dyin‏ ولكن عن طريق اختيار وجهات النظر التي يتم وصف البنود Flu‏ عليها. 

من الصعب فهم فكرة أن نفس مجموعة المعلومات يمكن أن تكون أكثر أو أقل وضوحاً 
Fly‏ على وجهة النظر التي يتم فحص تلك المجموعة من خلالها. في الأقسام ASW‏ سيتم 
تقديم عدة أمثلة تهدف إلى توضيح هذه الفكرة. 

تتشابه أنماط العلاقات المتبادلة بين مجموعة من البنود مع المواقع المادية في الفضاء. 
كلما كان بندان أكثر ارتباطاً كانت العلامتان الممثلتان لهذين البندين أقرب لبعضهما 
البعض. إذا Lod‏ بذلك للعديد من البنود, فإن اممواقع الفعلية لعلاماتها ستتخذ نمطا ثل 
blei‏ الارتباط بين المتغيرات (من الأسهل تصور ذلك إذا قصرنا أنفسنا على بعدين). إن 
تخيل مواقع الأجسام المادية التي تحددها القواعد الأساسية هو بالتالي» طريقة أخرى 
للتفكير في البنود التي يتم تحديد ارتباطاتها بواسطة المتغيرات السببية الأساسية. 


التشبيه الأول لتدوير العوامل: 

كيف يتيح لنا الدوران رؤية نمط بين المتغيرات الذي كان Lélo‏ هناك ولكن لم يكن 
واضحاً؟ كقياس» تخيل مجموعة من الأشياء ا منظمة dio due‏ مجموعة من الأعمدة مرتبة 
في سلسلة من الصفوف المتوازية والمنظمة. من ال ممكن الوقوف في مواقع معينة واختيار 
زوايا رؤية معينة بحيث يكون ترتيب الأشياء في الصفوف والأعمدة مخفياً بشكل كامل. ومع 
HS‏ تغيير زاوية الرؤية يمكن أن تكشف عن الترتيب الأساسي. فكر في LAS‏ ظهور ترتيب 
أربعة صفوف من ٠١‏ ركائز pillars‏ عند عرضها من وجهات نظر مختلفة. إذا م يكشف 
خط الرؤية عن أي من المحاور الطبيعية للترتيبات الخطيةء فقد تظهر الأعمدة بشكل 
عشواي. المشاهدة من موقع أعلى» أو التحرك بضعة أقدام Ling‏ أو يساراء أو مجرد تحوّل 
نظر المرء Ga)‏ إلى خط الرؤية يمكن أن يؤدي إلى الكشف عن انتظام الركائز وإظهار ترتيبهاء 
ويوضح الشكلان رقم (V-1)‏ ورقم (A-1)‏ هذه النقطة. هذه الأشكال تم إنشاؤها عن طريق 
رسم مواقع للأعمدة. وحرفياً تغيير موقع الرؤية الذي من خلاله تم عرض الأعمدة. lbg‏ 
فإن كلا الشكلين يمثلان نفس تكوين الأعمدة ويختلفان فقط في كيفية مشاهدتها. في الشكل 
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الأول من هذه الأشكال» من الصعب في أحسن الأحوال تمييز أي تنظيم لترتيب الركائز. يقع 
خط الرؤية الذي هر خلال المسافات بين الركائز على ركائز أخرى أبعد. جاعلاً التجمع يظهر 
ككتلة غير منظمة من الأشياء. Ute‏ الشكل الثاني من هذه الأشكال وجهة نظر بديلة. كل 
ركيزة. كما يوضح الشكل (A-1)‏ تشارك Éo‏ (وعمودًا) مع ركائز أخرى. وبالتاليء فإن جميع 
الركائز في صف معين لها شيء مشترك - فهي تمتلك سمة مشتركة (عضوية في نفس الصف) 
م تكن واضحة من موقع الرؤية السابق. إن مجرد تغيير زاوية الرؤية جعل شيئًا ما يتعلق 
بطبيعة الأشياء واضحاً كان في منظورنا الأولي غامضاً. دوران العوامل يشبه هذه المحاكاة في 
أنه يحاول توفير ”وجهة النظر“ التي من خلالها يصبح الهيكل التنظيمي للبيانات - الطرق 
التي تشترك بها البنود في بعض الخصائص - واضحاً. 

















شكل (V‏ ترتيب منظم للركائز التي يتم رؤيتها من منظور يحجب ذلك الترتيب 
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شكل (6-1): ترتيب منظم للركائز التي تتم رؤيتها من منظور يكشف عن ذلك الترتيب 


التشبيه الثاني لتدوير العوامل: 

تجدر الإشارة إلى Í‏ مع العدد الصحيح من الخطوط العمودية ال مرجعية: هكن للمرء 
تحديد موقع الأشياء بغض النظر عن LAS‏ توجيه هذه الخطوط المرجعية. مثال GUS‏ 
الأبعاد مثل ملعب كرة قدم كبير فارغ يمكن استخدامه للتوضيح. لجعل هذا المشهد أكثر 
إثارة للاهتمام SLAB‏ دعونا نفترض أن المدرب يستخدم مباراة فيديوء تم تصويرها من 
كاميرا علوية» لشرح اللعب لأعضاء الفريق. علاوة على US‏ افترض أن المدرب قد قام 
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بتجميد الصورة في لحظة مثيرة للاهتمام بشكل خاص أثناء اللعب لتوضيح نقطة معينة وأن 
هذه الصورة المجمدة يتم عرضها على شاشة كمبيوتر كبيرة تتيح للمدرب الرسم فوق تلك 
الصورة. يمكن للمدرب رسم خط مستقيم من خلال صورة ملعب كرة القدم في أي اتجاه 
ثم وضع خط ثانوي عمودي على الأول. على سبيل SUL!‏ قد يختار المدرب Las‏ واحدًا هتد 
تماماً شمالًا وجنوباً وآخر srg‏ على وجه التحديد شرقاً وغرباًء والتي قد تسمح له بوصف 
أي موقع في الحقل باستخدام إحداثيات تحديد المواقع الشاملة استنادًا إلى خط العرض من 
الشمال إلى الجنوب وخط الطول من الشرق إلى الغرب. باستخدام هذين الخطينء مكن 
للمدرب تحديد موقع اللاعب الذي deg‏ الكرة: «باستخدام إحداثيات تحديد المواقع 
الشاملة لوسط ال ملعب كمرجع: يكون حامل الكرة عند تقاطع نقطة محددة من خلال 
التقدم Vlad‏ من وسط الملعب لمسافة BI Te‏ ثم المضي قدمًا غربًا BIS FY‏ إضافيًا». هذا 
سَيُحدد Us‏ كرة القدم في مكان معين. يمكن للمدرب تحديد الموقع نفسه باستخدام 
تعليمات معدلة بشكل مناسب بناءً على أي خطين عموديين مرسومين في ملعب كرة القدم. 
لذلكء فإن اتجاه الخطوط هو yal‏ اعتباطي فيما يتعلق بكفاية وصف موقع معين. أي 
مجموعة من خطين عموديين لهما نفس الفائدة المعلوماتية في تحديد مكان معين مثل أي 
مجموعة أخرى. 

بدلاً من ذلكء بدلاً من استخدام امحورين شمال - جنوب وشرق - غرب» يمكن للمدرب 
استخدام الخطوط الجانبية وخطوط المرمى للملعب كمحاور متعامدة أساسية. مثل أي 
مجموعة أخرى من الخطوط Sroleibl‏ يمكن استخدام هذه المحاور كمراجع لتحديد موقع 
أي نقطة في ا ملعب. ومع LIS‏ فهي تتمتع بميزة الاستفادة من ميزة ذات مغزى في 
ا ملعب - تنظيمها كشبكة محددة بخطوط متعامدة (أي خطوط ساحة ال ملعب والخطوط 
الجانبية). Why‏ فإن إخبار شخص ما بأن حامل الكرة كان ع أقدام داخل خط ال Y.‏ 
ياردة وحوالي TA‏ قدمًا من الخط الجانبي ملعب الفريق المضيف, قد تكون وسيلة أسهل 
لتحديد موقع هذا اللاعب من استخدام الخطوط ال مرجعية ال ممتدة بين الشمال والجنوب 
والشرق والغرب. النقطة المهمة هي أنه في حين أن أي مجموعة من glock!‏ الطرجعية 
يمكنها تحديد موقع حامل الكرة بشكل لا لبس فيه. فإن اممجموعة القائمة على الخصائص 
الطبيعية ملعب كرة القدم تبدو أكثر ملاءمة وشمولية (انظر الشكل رقم 3-7). 
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الآن وقد رأينا كيف يمكن استخدام المتجهات أو الخطوط dyer yb)‏ لتحديد موقع مكاني» 
يجب أن نفحص كيفية ارتباط البنود بخطوط مرجعية مماثلة. ومع ذلك قد يكون من 
الصعب التبديل بين التفكير في البنود ومحتواها من ناحية والتفكير في المتجهات المجردة 
التي تحدد Slob!‏ من ناحية أخرى. في كثير من GLE‏ الأمثلة التي تربط البنود الأكثر 
مألوفية بتمثيلها المكاني على طول المتجهات يجب التغاضي عنهاء لأن الأشياء التي نقيسها 
كعلماء اجتماع وسلوك لا تتناسب dole‏ مع ترجمة مباشرة بالحدود ال مكانية. لسد هذه 
الفجوةء سأقدم مثالا مختلقاً (غير حقيقي) استنادًا إلى بنود يمكننا ربطها با مواقع المادية. 
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التشبيه الثالث لتدوير العوامل: 

امتداداً لمثال كرة القدم لديناء سوف نفترض دراسة تستخدم بنود الاستبانة كوسيلة 
لوصف موقع لاعب كرة القدم (الشخص الذي يحمل الكرة) في الملعب. وبشكل أكثر 
ico dasad‏ تفترض أنه يطلب من مجموعة :من اللستطلعين مشاهدة pda‏ عن لعبة 
كرة القدم» وعند نقطة cle‏ يتم تجميد الصورة ويطلب من المجيبين الإجابة على سلسلة من 
فمانية بنود باستخدام مقياس ليكرت المتدرج والذي يتراوح من ١‏ = لا أوافق بشدة إلى ٦‏ = 
أوافق بشدة. هذه البنود كالتالي: 
4- حامل الكرة في موضع تهديف سهل. 
-B‏ قد يتم إجبار حامل الكرة على الخروج من الحدود سريعاً. 
-C‏ قد يُجبر حامل الكرة إلى منطقة النهاية الخاصة به. 
-D‏ حامل الكرة لديه مساحة كبيرة لأي من الجانبين. 
-E‏ إذا تم إيقاف حاملة الكرة الآن» شخص ما على الخطوط الجانبية قد يكون في خطر. 
-F‏ أمام حامل الكرة طريق طويل قبل عبور خط المرمى. 
-G‏ حامل الكرة داخل النطاق المميداني للمرمى. 
-H‏ يجب أن يكون حامل الكرة حريصاً على عدم تجاوز الخط الجانبي. 

قبل المتابعة مع JELI lio‏ دعونا نتوقف للحظة بشكل أكثر رسمية للتعرف على كيفية 
دوران العوامل. عندما يكون لدينا عاملان» فإنه يممكن تحقيق الدوران Like‏ ويمكن للمرء 
الحصول على الشكل الانتشاري scatterplot‏ الذي هثل قوة الارتباطات بين أزواج من 
البنود عن طريق القرب من هذه البنود وتشبعات loadings‏ تلك البنود على متجهات 
مرجعية اعتباطية iblis‏ لاثنين من العوامل الغير مدارة. Se‏ للمرء إجراء دوران رسومي 
من خلال تدوير تلك ال محاور حتى تسقط على مجموعات البنود. بعد US‏ يتم استخدام 
المحاور المرجعية لإنشاء إحداثيات تحدد الموضع الدقيق لكل بند ممثل من حيث موقعه 
بالنسبة إلى الأطوال على امتداد المحورين. ويمكن بعد ذلك تحويل هذه الإحداثيات إلى 
تشبعات لكل بند على هذين العاملين. ولكن طرق الدوران غير الرسومية الآلية القائمة على 
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ا معايير الرياضية تستخدم على نطاق أوسع. على سبيل JEL‏ تسعى أساليب مثل التباين 
الأعظم Varimax‏ إلى زيادة تباين التشبعات المربعة لكل بند. التشبعات هي عبارة عن 
ارتباطات بين كل بند وكل عامل Fly‏ على اتجاه المتجهات gl)‏ الخطوط المرجعية) التي 
تحدد العوامل. وبناءً على الكيفية التي يتم بها توجيه اممتجهات» ستتباين التشبعاتء GE‏ 
كما تتباين القيم التي تحدد موقع لاعب BS‏ قدم في الملعب أو الإحداثيات التي تصف 
موضع نقطة ما على الشكل الانتشاري اعتمادًا على المحاور ا مرجعية ا مستخدمة. سيكون 
هذا التباين أكبر عندما تكون بعض التشبعات المربعة كبيرة نسبيًا والبعض الآخر صغيراً 
نسبيًا. Why‏ فإن تلبية معيار تعظيم تباين التشبعات المربعة له تأثير في إنتاج مجموعة 
متفاوتة القيم القصوى من التشبعات لكل بند. العثور على اتجاه للمحاور المرجعية التي 
ستمنحنا تشبعات متفاوتة القيم القصوى والقيم الأكبر لتباينات التشبعات المربعة سيؤدي 
إلى إيجاد الدوران الذي من المحتمل أن يكون مفيداً. ما نسعى cal)‏ بالطبعء هو نوع معين 
من التفاوت بحيث يكون تشبعاً واحداً agi)‏ تشبع البند على العامل الأساسي) كبيراً في حين 
أن جميع التشبعات الأخرى لهذا البند (على سبيل JELI‏ التشبعات الخاصة به على العوامل 
الثانوية) صغيرة (من الناحية AJE‏ قريبة من الصفر). عندما يتحقق US‏ ممكننا وصف 
البند بأنه يتأثر بشكل أساسي بالعامل الفردي الذي يتشبع عليه بشكل كبير - وهي الحالة 
التي تدعى الهيكل البسيط. إن وصف بند من خلال عامله الأساسي فقط يقوم بعمل جيد 
لالتقاط الطبيعة الأساسية للمعلومات التي يحملها البند. هذا هو هدف الدوران. 


الآن» دعونا نعود إلى البنود التي تصف موقع حامل الكرة في الصورة المجمدة للعبة 
كرة القدم. لقد تم تحليل هذه البنود الثمانية ty)‏ على بيانات مزيفة) لأغراض توضيحية. 
وكانت الجذور الكامنة الثلاثة الأولى ۳,۹۷ و۲۷۸ 0%9,+. بناءً على الحقيقة أن القيمتين 
الأوليين أكبر بكثير من ٠,١‏ بينما الثالثة أصغر بكثير من 2٠١‏ وتم استخراج عاملين. حيث 
طلب من برنامج SAS‏ إجراء دوران بأسلوب التباين الأعظم Varimax‏ على العوامل. 
الشكلان رقمي (V-71)‏ و(5-١1١)‏ يوضحان رسومات العوامل باستخدام برنامج SAS‏ قبل 
وبعد الدوران» على التوالي. وهذه تحدد موقع البنود فيما يتعلق بالعاملين Elo‏ على تشبع 
كل بند على هذين العاملين. 


تطوير المقاييس: النظرية والتطبيق yyv‏ 


الفصل السادس 


يقوم 545 بطباعة رسومات بيانية خاصة للعوامل بخط يستخدم العرض المتساوي 
لكل حرف ولا يستطيع التقدير interpolate‏ بين خطوط من النصوص. Why‏ لا مكن 
تحديد موقع النقاط بالنسبة لبعضها البعض أو إلى متجهات العوامل بدقة تامة. ومع ذلك 
حتى مع هذا القيد. فإن الرسومات البيانية إيحائية تماماً. في الشكل رقم )٠١-١(‏ يتم 
تجميع البنود ilias)‏ بأحرف داكنة في مربعات مظللة لرؤية أكثر وضوحًا) في مجموعتينء 
إحداهما تشتمل على البنود Ho Eg Do B‏ والأخرىء البنود A‏ و۴ Cg‏ و6. القرب بين 
البنود يشير إلى قوة الارتباط في هذا الشكل. لذلك» أي بندين يقعان بالقرب من بعضهما 
البعض مرتبطان بدرجة كبيرة أكثر من أي زوج بعيد. وبالتالي» يشير وجود مجموعتين في 
هذا الشكل إلى أن البنود الموجودة في كل مجموعة ترتبط ارتباطًا وثيقًا ببعضها البعض وأن 
البنود ال موجودة في مجموعات مختلفة غير مرتبطة إلى حد كبير ببعضها البعض. المواقع 
بالنسبة إلى المحاور هي أيضاً مفيدة وذات صلة خاصة مسألة الدوران. تقع مجموعة 
A-F-C-G agil‏ على بعد متساو تقريبًا من المتجهين الممثلين للعوامل. أي إن تشبعاتها 
على كل عامل تقريبًا بنفس الحجم. مجموعة البنود الأخرىء على الرغم من أنها أقرب إلى 
حد ما من المتجه الرأسي منها إلى المتجه الأفقيء» فإنها لا تزال على مسافة من أي منهما. 
تحتوي البنود ا موجودة في المجموعة الثانية على تشبعات أعلى على العامل ١ء‏ ولكن أيضًا 
تشبعات (سالبة) كبيرة إلى حد ما على العامل Y‏ وبالتالي» سيكون من الصعب القول إن أي 
من مجموعتي البنود يعكس بشكل أساسي مستوى واحداً فقط من العوامل. 

في المقابل» في الشكل الذي تم إنشاؤه بعد أن تم تدوير العواملء نلاحظ أن IS‏ من 
المجموعتين قريبة le‏ من متجه واحد فقط. ال مجموعة الأولى من البنود (B-D-E-H)‏ 
لديها الآن تشبعات عالية (تقريبًا من ٠,۸‏ إلى 258( على العامل alig) ١‏ المحور الرأسي) 
وتشبعات منخفضة على العامل ۲ (أقل من .)٠,١‏ المجموعة الثانية (A-F-C-G)‏ قريبة 
من العامل ۲ (المحور الأفققي». وكل البنود مجتمعة تمثل قيم عالية على العامل Y‏ (تقريبًا 
في حدود ٠,۸١‏ إلى )0,5١‏ وقيم منخفضة على العامل ١‏ (حوالي .)٠,٠١‏ 


۸ تطوير المقاييس: النظرية والتطبيق 


التحليل العاملي 
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شكل )43-1( العناصر الممثلة بيانياً بواسطة التشبعات على عاملين قبل الدوران 
SI‏ بعد الدورانء لدينا تقريب أفضل بكثير لهيكل بسيط من توزيع البنود على 
العوامل - asl‏ كل بند يتشبع بشكل أساسي على عامل واحد. 
إذا نظرت بعناية إلى ال مواقع النسبية لمجموعتي البنود في الشكلين المختلفين» قد تكون 
قادرًا على التمييز على أنهما متشابهان إلى حد كبير (في حدود الرسم البياني ل (SAS‏ 


تطوير المقاييس: النظرية والتطبيق ۳۹ 


الفصل السادس 


مجموعة البنود gi A-F-C-G‏ حوالي ٠١‏ درجة في اتجاه عقارب الساعة من المجموعة 
B-D-E-H‏ في كلا الشكلين. هذا كما يجب أن يكونء لأن الدوران لا يغير العلاقات بين 
امتغيرات. لو كانت البنود مرسومة على ورقة شفافة والعوامل على ورقة شفافة أخرىء 
فإنه يمكنك تدوير الورقة المحتوية على البنود من الموضع الموضح في الشكل رقم )٠١-5(‏ 
إلى الموضع ال موضح في الشكل رقم )11-1( الخاصة بالعوامل. 
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شكل )41-1( العناصر ال ممثلة بيانياً بواسطة التشبعات على عاملين بعد الدوران 


Yes‏ تطوير المقاييس: النظرية والتطبيق 


التحليل العاملي 


(حقيقة أن المحاور الأفقية والعمودية لها مقايبس مختلفة قليلاً بسبب عدم الدقة في 
كيفية عرض 5485 للرسوم البيانية» قد تجعل مسافات المجموعات من الأصل أقل Glis‏ في 
الشكلين مما هي عليه بالفعل (Gone‏ في الحقيقة. إن الدوران يعيد فعلاً توجيه العواملء 
ولكن بدلاً من عرض محاور العامل بزوايا غريبةء تقوم رسومات ما بعد الدوران بشكل 
أساسي بتدوير مواقع البنود في اتجاه عقارب الساعة بدلاً من تدوير المحاور في اتجاه عكس 
عقارب الساعة. 


بعد تدوير العوامل» أصبح من ال ممكن الآن تفسير كل منها من خلال النظر في BL‏ 
تشترك البنود التي حققت تشبعات عالية على كل من العوامل. البنود التي تشكل العامل 
الأول جميعها تتعلق بالقرب من الخطوط الجانبية للملعب» وتلك التي تشكل العامل الثاني 


الجانبية والعامل Y‏ على أنه القرب من bobs‏ المرمى. لقد سمح لنا الدوران بتجميع البنود 
بطريقة سهلت التعرف على السمة العامة المشتركة بين البنود داخل كل مجموعة. 
باختصارء إن أهم النقاط التي تدل عليها هذه الأمثلة حول دوران العوامل هي كما 
يلي: (I)‏ معرفة العدد الصحيح للعوامل (عندما يكون هناك أكثر من عامل واحد)» رغم 
أنه ضروريء لا يكشف عن طبيعة تلك العوامل. عملية استخراج العوامل الأولية تتناول 
فقط عدد العوامل المطلوبةء وليس daub‏ تلك العوامل بأي معنى جوهري. (ب) في حالة 
غياب دوران العوامل المتعددة. OLS‏ أي نمط ذي معنى وقابل للتفسير بين البنود هكن 
حجبه. الحل USVI‏ لاستخلاص العوامل يتجاهل محتوى ogil‏ وعادةً ما تكشف تجمعات 
البنود sly‏ على عوامل غير مدارة القليل عن تلك البنود. ويوضح تصوير الركائز من منظور 
غير ملائم ومن ثم منظور ملائم هذه النقطة. (ج) يمكن لأي حل تحلياي يشتمل على 
العدد الصحيح من العوامل تحديد العلاقات بين البنود o)‏ إذا وصفناها Xe‏ أي مواقع 
البنود بالنسبة لبعضها البعض) بالإضافة إلى غيرها. تعمل المحاور الشمالية - الجنوبية 
والشرقية - الغربية GLE‏ كما تعمل محاور المرمى - المرمى والخطوط الجانبية - الخطوط 
الجانبية لتحديد أي موقع في ا لملعب. (د) الغرض من تدوير العوامل هو إيجاد اتجاه معين 
للمحاور المرجعية التي تساعدنا على فهم البنود بعبارات بسيطة. يتم تحقيق ذلك عندما 


تطوير المقاييس: النظرية والتطبيق yes‏ 


الفصل السادس 


يمكن شرح معظم محتويات البنود باستخدام أقل sus‏ ممكن من المتغيرات - من الناحية 
المثاليةء واحد فقط. (ه) ممكن أن يسهل hè‏ العوامل المدارة تحديد ما هو مشترك بين 
البنود داخل عامل ما وبالتالي استنتاج ما هو العامل السببي الأساسي الذي يحدد LAS‏ 
الإجابة على البنود. كانت ال مجموعتان من البنود المتعلقة موقع حامل الكرة في لعبة BS‏ 
القدم مختلفة بشكل واضح. مجموعة واحدة تتعلق فقط بالقرب من الخطوط الجانبية, 


على الأقل مؤقتاء أن تصورات القرب من الحدود ال مختلفة لملعب كرة القدم تحدد كيفية 
تقييم المجيبين لمجموعتي البنود. بالطبع ستكون هناك حاجة إلى معلومات års‏ إضافية 
لدعم هذا الاستدلال. 


التدوير المتعامد مقابل التدوير المائل: 


تستند جميع الأمثلة حتى الآن إلى خطوط مرجعية متعامدة مع بعضها البعض. هذا 
يتوافق مع العوامل التي هي مستقلة إحصائيًا عن بعضها البعض (أي غير مترابطة). مثل 
هذه العوامل توصف بأنها متعامدة .orthogonal‏ لا يوفر الموقع على طول خط (محور) 
ما أي معلومات تتعلق بالمعلومات الموجودة على طول الخط الآخر عندما يكون الخطان 
متعامدين. على سبيل JULI‏ معرفة مدى بعد أي شخص شمالاً لا تعطي مؤشرًا على معرفة 
مدى بعده byt‏ لأن هذين الاتجاهين متعامدان مع بعضهما البعض. bbg‏ معرفة مدى 
بُعد اللاعب عن خط ال مرمى لا تعطي مؤشراً على قربه من الخط الجانبي. ومع US‏ من 
الممكن السماح للعوامل LVL‏ وبالتالي» فإن المحاور التي تمثلها بشكل Gly‏ تكون غير 
متعامدة. لنفترضء على سبيل المثال» ننا اخترنا تحديد مواقع في ملعب SS‏ القدم كما هو 
موضح في الشكل (1-1) باستخدام خط هتد من منطقة النهاية إلى منطقة النهاية كمحور 
وخط هتد شرقًا وغربًا مثل الآخر.التحرك في اتجاه غربي يعني Lda‏ التحرك نحو إحدى 
مناطق النهاية. أي أنه لا هكن للمرء أن يتحرك مباشرةً شرقًا أو غربًا دون تغيير مسافته عن 
خطوط ال مرمى. البعدان يرتبطان إلى حد le‏ 

ebb‏ هكن أن يسمح دوران العوامل للمحاور المرجعية (والعوامل التي تتوافق معها) 
لتكون مرتبطة» وبالتالي» لا تكون متعامدة G‏ يشار إلى هذا الدوران على أنه مائل 


yey‏ تطوير المقاييس: النظرية والتطبيق 


التحليل العاملي 


oblique‏ بدلاً من المتعامد. قد يكون الدوران المائل مفيدًا Lewis‏ يُعتقد أن المتغيرات 
الكامنة ترتبط ببعضها البعض. يتطلب هدف الهيكل البسيط البنود التي يمكن تصنيفها 
بشكل مفيد فيما يتعلق بفئة واحدة فقط. آي يجب أن يكون كل بند ”عن“ شيء واحد 
فقطهء وبالتالي» يتشبع load‏ على عامل واحد فقط. إذا كانت المتغيرات مرتبطة إلى حد 
ما ولكن العوامل التي تمثلها أجبرت إلى أن تكون مستقلة GLE‏ بسبب القيود التي تفرضها 
طريقة تحليل العوامل» فقد يكون من المستحيل تحقيق هذا الهدف. أي إن أكثر من عامل 
قد يرتبط ببعض أو كل البنود بسبب الارتباط بين العوامل؛ نحن محدودون في قدرتنا على 
التقريب للهيكل البسيط (انظر الشكل رقم .)١١-١‏ 

بالعودة إلى مثال خصائص زميل العمل السابقء إذا كان ”الاجتهاد“ و”الاعتمادرة“ 
مترابطين di>‏ فمن المحتمل أن يتقاسم بند عن أحدهما بعض التباين مع الآخر أيضًا. 
الأشخاص الأكثر اجتهاداً سيكونون أيضًا أكثر اعتمادًا إلى حد ما (بدرجة أكبر أو أقل استنادًا 
إلى قوة الارتباط بين السمتين). إن فرض حل متعامد على البيانات التي تعكس هذين 
المتغيرين سيجعل من الصعب للغاية على البند أن يتشبع بشكل قوي على متغير واحد 
وبشكل ضعيف على الآخر. ومع US‏ إذا سمح للعاملين ob‏ يكونا مترابطين إلى حد 
cle‏ تكون الحالة مشابهة تقريبًا للاستنتاج التالي: ”الاجتهاد“ و”الاعتمادية“ يُفهم أنهما 
يرتبطان ببعضهما البعض. وقد تم التعامل مع هذه الحقيقة من خلال السماح للعوامل 
بالارتباط. الآنء إلى جانب ذلك إلى أي من هذه العوامل يرتبط البند المعني بشدة؟ إذا م 
يتم إجبار المحاور التي تمثل عامل ”الاجتهاد“ وعامل ”الاعتمادية“ على أن تكون متعامدة 
فمع زيادة الدرجات على أحد المتغيرات» GX‏ استيعاب درجة ما من الزيادة ا لمصاحبة 
في المتغير الآخر. 


تطوير المقاييس: النظرية والتطبيق yey‏ 


الفصل السادس 











شكل )17-1( نموذج بعاملين مع السماح للعاملين بالارتباط 


إذا كان الواقع يفرض أن البند الذي يتأثر بشكل كبير ب «الاجتهاد» يتأثر La)‏ ب 
«الاعتمادية». فإن السماح للعوامل التي تمثل تلك المفاهيم البنائية بالترابط هكن أن 
يستوعب تلك الحقيقة بشكل أكثر دقة. قد يكون البند الذي يرتبط ارتباطًا وثيقًا ب 
”الاجتهاد“ ولكنه يرتبط بشكل معتدل ب ”الاعتمادية“ قادرًا على التشبع بقوة على أول 
تلك العوامل وبشكل ضعيف على الثاني إذا كانت العوامل غير مقيدة بالاستقلال الإحصان. 
معنى» حقيقة أن هذا البند له SE‏ سببي ناشئ عن ”الاعتمادية“ يتم استيعابه من خلال 
السماح للعاملين بالترابط مع بعضهما البعض. يوفر هذا مسارًا غير مباشر من ”الاعتمادية“ 


vee‏ تطوير المقاييس: النظرية والتطبيق 


التحليل العاملي 


إلى البند من خلال ”الاجتهاد“ (انظر الشكل رقم (V-T‏ مما يزيل الحاجة إلى ارتباط البند 
مباشرة ب ”الاعتمادية“ وبالتالي التشبع المتقاطع على كلا العاملين. 

ما يتم فقدانه عندما يتم تدوير العوامل بشكل مائل (غير متعامد) هو أناقة وبساطة 
الأبعاد غير المترابطة. إحدى المزايا الجذابة للعوامل غير المترابطة هي أن تأثير العوامل 
مجتمعة عبارة عن حاصل المجموع البسيط لتأثيراتها منفصلة. مقدار المعلومات في 
قيمة بند معين الذي يفسره أحد العوامل يمكن إضافته إلى مقدار المعلومات الذي يفسره 
عامل آخر للحصول على إجمالي مقدار المعلومات المفسرة بالعاملين مع بعضهما البعض. 
في العوامل AGL‏ الحال ليس كذلك. 














شكل KE :)١-5(‏ للارتباطات بين العواملء يؤثر العامل ١‏ على البند A‏ بشكل مباشر (المسار الصلب 
الداكن) وغير مباشر (المسار المتقطع الفاتح) 


تطوير المقاييس: النظرية والتطبيق Yeo‏ 


الفصل السادس 


ولأن العاملين مترابطان» يوجد تكرار في المعلومات الواردة في هذين العاملين. بالنسبة 
إلى بند يتعلق بكل من العاملين «الاجتهاد» و«الاعتمادية»» فإن مقدار التباين الذي يفسره 
هذان العاملان Le‏ أقل من مجموع تباين العوامل منفصلة. بعض المعلومات» وربما قدرٌ 
كبيرٌ منهاء التي يستأثر بها أحد العوامل تتداخل مع المعلومات التي يستأثر بها العامل 
الآخر. محصلة المجموع البسيط للمعلومات ستتضمن ال معلومات المتداخلة مرتين» والتي 
لن تعكس بدقة التأثير الكلي للعوامل على ذلك البند. 

ومن المضاعفات الأخرى للعوامل المترابطة التعقيد المضاف للعلاقات السببية بين البنود 
والعوامل. عندما تكون العوامل مستقلة. تكون العلاقة الوحيدة بين عامل وبند معين 
مباشرة. ستؤدي التغييرات في مستوى العامل إلى تغييرات في البند على امتداد مسار سببي 
مباشر واحد. غير أن هذا ليس هو الحال عندما تكون العوامل مترابطة. إذا كان (كما 
هو موضح سابقًا عند مناقشة بند متأثر ب ”الاجتهاد“ و”الاعتمادية“) يؤثر كلاً من عاملين 
افتراضيين على البند A‏ على سبيل SEB!‏ وكان العاملان مترابطين» فإن العاملين يمارسان 
تأثيراً غير مباشر وكذلك مباشر على البند ging -A‏ يمكن للعامل ١‏ التأثير على العامل Y‏ 
ومن خلال العامل ”3 التأثير بشكل غير مباشر على البند A‏ هذا بالإضافة إلى التأثير المباشر 
للعامل ١‏ على ذلك البند. 

بالطبع» وبعملية موازية» يمكن للعامل ۲ أيضًا التأثير على البند ليس فقط بشكل مباشر 
ولكن Las}‏ بشكل غير pile‏ من خلال علاقته بالعامل .١‏ نفس النوع من التأثير المباشر 
وغير Lb!‏ للعوامل ينطبق على جميع البنود الأخرى. نتيجة UU‏ عند الحديث عن 
العلاقة بين بند وعامل فإنه Sole‏ ينبغي أن تكون هذه العلاقة مؤهلة بشكل صريح Le]‏ 
لإدراج أو استبعاد مثل هذه التأثيرات غير امباشرة. خلاف LIS‏ يوجد غموضء Why‏ 
ارتباك محتمل. 
اختيار نوع التدوير: 

كمسألة dues‏ يجب أن يعتمد الاختيار بين الدوران المتعامد والدوران المائل على واحد 


أو أكثر من الاعتبارات. من بين هذه الاعتبارات كيف ينظر اط مرء إلى المفاهيم التي تمثلها 
العوامل. إذا كانت النظرية تشير بقوة إلى مفاهيم مترابطة» فربما يكون من المنطقي أن 
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يتبع النهج التحليلي للعوامل de)‏ وجه التحديد, الدوران) ذلك. وبالتاليء إذا كان تحليل 
العناصر المتعلقة ب ”الاجتهاد“ و”الاعتمادية“ فإن السماح للعوامل بالارتباط من شأنه أن 
يناسب إدراكنا ا تنطوي عليه هذه المفاهيم. Lage‏ عن WS‏ قد تقترح النظرية عوامل 
متعامدة. على سبيل JEL!‏ قد تكون ”الاعتمادية“ و”المرح“ أكثر استقلالية» وبالتالي قد 
تتطلب حلاً متعامدًا. عندما لا تقدم النظرية دليلاً قوي مثلما هثل مقياس قيد التطوير 
مفاهيم م تتم دراستها من LS‏ فإن حجم الارتباطات بين العوامل قد يكون Ales‏ دليل. 
على وجه التحديد» يمكن تحديد الدوران SU!‏ ودراسة قيم الارتباطات الناتجة بين العوامل. 
إذا كانت قيم هذه الارتباطات صغيرة Me‏ (على سبيل SEL)‏ أقل من 40+( فقد يختار 
محلل البيانات الدوران المتعامد. هذا يقدم حلاً وسطاً لتقريب الهيكل البسيط ولكن 
ينتج عنه نموذج أبسط. على سبيل Lb)‏ قد تُظهر بعض البنود تشبعات ثانوية gre)‏ 
تشبعات على عامل آخر غير تلك التي تتشبع عليها بقوة أكبر) والتي تزداد بشكل طفيف 
بالنسبة للحل SUL)‏ ولكنها لا تزال صغيرة بشكل كاف لربط كل بند بشكل غامض مع عامل 
واحد فقط. Why‏ قد تكون تشبعات بند معين على ثلاثة dolge‏ تم تدويرها بشكل مائل 
هي ١,١79 +,VA‏ 09+,+. عند اختيار الحل المتعامد. قد تكون التشبعات هي لالارء وره 
و١١,:.‏ على الرغم من أن النموذج الثاني يبتعد أكثر بقليل من الأول عن الهيكل البسيطء 
إلا أنه لا يزال من الممكن ربط البند المعني بشكل لا لبس فيه بالعامل الأول. وبالتالي» تمت 
التضحية بالقليل في سبيل اختيار النموذج الأبسط (أي المتعامد) في هذه الحالة. إذا كانت 
العوامل مرتبطة بدرجة آكبرء فإن اختيار الحل المائل قد يؤدي إلى تحسن كبير في التقريب 
للهيكل البسيط. على سبيل JELI‏ قد يتضاءل تشبع ثانوي مقداره ٠,2١‏ تم الحصول عليه 
بتدوير متعامد إلى ٠,10‏ بحل مائل. لن يكون هذا هو الحال Glo‏ ومع ذلك OB‏ دراسة 
الفرق بين طريقتي الدوران فقط يمكن أن تشير بشكل قاطع إلى أي مدى تختلف في تقريب 
الهيكل البسيط. 

المسألة العملية الأخيرة تتعلق بحجم الارتباط بين عاملين وكم يجب أن يكون حجم 
الارتباط قبل دمج العاملين في عامل واحد أكبر. لا توجد إجابة بسيطة على هذا السؤال لأن 
العلاقات بين البنود والعوامل تحتاج أيضًا إلى النظر فيها. ومع US‏ في بعض Ved!‏ قد 
يكشف الدوران GU‏ أنه حتى عندما يكون هناك عاملان يرتبطان ارتباطًا Hus‏ فإن بعض 
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البنود لها تشبعات كبيرة على كليهما. في هذه Aled)‏ قد يكون من المنطقي استخلاص 
عوامل أقل لمعرفة ما إذا كان العاملان ال مرتبطان إلى حد كبير يمكن دمجهما في عامل واحد. 
قد يكون» على سبيل JELI‏ جيدًا أن تدعم بيانات الحياة الواقعية عاملاً واحداً يجمع بين 
البنود المتعلقة ب ”الاجتهاد“ و“الاعتمادية“ بدلاً من الفصل بينها. 


النماذج العاملية الثنائية والهرمية: 


تقريبًاء تفترض جميع أساليب تطوير المقاييس التي تمت مناقشتها في هذا الكتاب أن 
البنود المكونة للمقياس أحادية البعد. التحليل العاملي هو الأداة المفضلة لتحديد البنود 
المرشحة المحتملة التي ستناسب هذا الافتراض. على الرغم من أن المجموعة الكاملة من 
البنود التي يهتم بها الباحث قد تكون متعددة الأبعادء إذا كان بإمكانه تحديد مجموعات 
فرعية أحادية البعد. فإنه عندئذ هكن معاملة كل من هذه المجموعات الفرعية كمقياس 
منفصل وأن العمل على تطوير أداة قياس gl)‏ رها مزيد من ABW!‏ مجموعة من أدوات 
القياس ذات الصلة) يمكن أن يستمر. 

قبل هذه النقطة» كانت مناقشتنا للتحليل العاملي حول النموذج التحليلي للعوامل 
المتعددة الأبعاد الأكثر شيوعًاء أي نموذج قائم على هيكل بسيط. تذكر أنه تم Bog‏ 
الهيكل البسيط بأنه موجود عندما يكون لكل بند تشبع قوي على عامل واحد فقط (والذي 
أشرنا إليه كعامل أساسي) وتشبعات ضعيفة على جميع العوامل الأخرى (أي الثانوية). 
وبإعادة الصياغة من منظور العوامل بدلاً من البنودء بالنسبة ممفهوم الهيكل البسيطء يعد 
كل عامل محددًا قويًا لبعض البنود GI)‏ البنود التي نعتبرها Ég‏ لذلك العامل) ومحددًا 
Laws‏ للبنود المتبقية. نحن على وشك النظر في بدائل لنماذج الهيكل البسيطء ولكن 
نحتاج بعض التوضيح Vol‏ النموذجان الموصوفان في الأقسام التالية هماء مرة أخرىء نماذج 
متعددة الأبعاد (أي متعددة العوامل)ء لكن العلاقات بين البنود والعوامل لا تتوافق مع 
الهيكل البسيط مثل النماذج السابقة. Elio‏ بنهج الهيكل البسيط تمثل هذه النماذج 
طريقة مختلفة للتفكير في العوامل المتعلقة بالبنود. كما سنرىء بالنسبة لهذه النماذج» SUS‏ 
البنود Le‏ هكن أن نسميه بالعامل الشامل global factor‏ والعامل الموضعي local factor‏ 
وسنقوم في النهاية بتحسين هذه ال مصطلحات بحيث تتناسب مع كل نموذج من النماذج 
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التي نناقشهاء ولكن هذه المصطلحات العامة ستخدم غرضنا في الوقت الحالي وستسمح لنا 
بالتمييز بين هذين النموذجين كثنائي عن تلك التي تطرقنا لها سابقا. 

ISLL‏ نحتاج إلى نماذج تحليلية للعوامل غير تلك LEW‏ على الهيكل البسيط؟ بعض 
مجموعات البنود ببساطة لا تتوافق مع الهيكل البسيط. قد تظهر Wel Sole‏ (شاملاً) 
Hus‏ ولكنها تظهر Las)‏ أدلة على مجموعات من البنود تشير إلى مكونات فرعية متماسكة 
ومتجانسة (عوامل موضعية). بمعنى أنه يبدو أن البنود لها عضوية مزدوجة, في العامل 
الأول الذي تشترك فيه جميعها وأيضًا في عوامل إضافية تشترك فيها مجموعات فرعية من 
البنود. السؤال الذي يطرح نفسه هو ما إذا كانت هذه البنود بأي حال من الأحوال أحادية 
البعد al‏ أنها متعددة الأبعاد لا محالة. با معنى الدقيق للكلمة» لا هكن وصف البنود على 
أنها أحادية البعد استنادًا إلى الدليل Ob‏ النموذج العاملي بسيط الهيكل سينتج. ومع US‏ 
إذا USE‏ بطريقة ما من وضع هذا العامل الأول الشامل جانباً فإن علاقات البنود بالعوامل 
الموضعية قد تبدو إلى حد كبير مثل المتغيرات الكامنة المعرّفة مجموعات فرعية من البنود 
التي يبدو أن لها هيكلاً بسيطاً وبالتالي فهي أحادية البعد داخل Cle garb!‏ الفرعية. ولكن 
كيف هكننا تجاوز مشكلة العضوية المزدوجة والتغلب على نواة الهيكل البسيط؟ النماذج 
التي تم وصفها هنا قد توفر الوسائل لذلك. وقد قدم )2010 (Reise, Moore, Haviland,‏ 
ملخصًا ممتارًً لهذه النماذج» وتمت الاستفادة من رؤاهم بشكل كبير فيما Slew‏ 

سننظر في نوعين من النماذج غير GIS‏ الهيكل البسيط. نموذج GLS‏ العوامل 
bifactor model‏ ويحدد Male‏ عاماً (اسم للعامل الشامل في سياق النماذج ثنائية 
العوامل) يساهم في التباين في جميع البنود ويحدد أيضاً مجموعة من العوامل الخاصة 
specific factors‏ غير المترابطة (مصطلح العوامل ال موضعية داخل النموذج ثنائي العوامل) 
التي تساهم في التباين في مجموعات فرعية من البنود (انظر الشكل رقم .)١5-1‏ وبالتالي» 
في JELI‏ الموضحء يتلقى كل بند ÉL‏ من العامل العام بالإضافة إلى عامل واحد خاص فقط. 
باستخدام النموذج ثنائي العواملء لدينا تشكيلة من المتغيرات التي تشبه أحادية البعد على 
مستوى السمات الخاصة على الرغم من وجود dole dow‏ إذا تم تطبيق النهج التحليلي 
العاملي التقليدي بسيط الهيكل على البيانات التي تتناسب مع نموذج GE‏ العوامل» فإن 
البنود تميل إلى التشبع المتقاطع cross-load‏ على العامل الأول (ملتقطة في المقام الأول 


تطوير المقاييس: النظرية والتطبيق ved‏ 


الفصل السادس 


نفس التغير الكامن الذي يقوم به العامل العام في نموذج GUS‏ العوامل) وسمة أو أكثر 
من السمات الخاصة. في هذا النهج» يؤدي حساب العامل العام بشكل أساسي إلى تحديد 
التباين المشترك بين جميع البنود. وما تبقى هي أكثر مصادر التباين محدودية (العوامل 
الخاصة (specific factors‏ قد تظهر البنود الموجودة داخل كل من هذه العوامل أحادية 
البعد الأساسية. بمعنى أن كل بند قد يتم تشبعه بقوة على عامل واحد خاص فقطء وقد 
يحتوي كل عامل من العوامل الخاصة على بنود يمكن تفسيرها بسهولة على أنها تمثل 
مفاهيم بنائية constructs‏ متمايزة ومتماسكة. 








شكل (165-5): نموذج GUS‏ العوامل 
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من الواضح أن النموذج ثنائي العوامل مناسب Cle gach‏ البنود التي لها متغير كامن 
شامل (ele asl)‏ وموضعي asl)‏ خاص) تمارس HSE‏ عليها. وينطبق هذا أيضًا على النهج 
التحليلي العاملي الآخر الذي قد يبدو مشابهاً للنموذج GLI‏ العوامل للوهلة الأولى» وهو 
النموذج الهرمي hierarchical model‏ في النموذج الهرمي (انظر الشكل رقم (VO-7‏ 
تندرج مجموعة من العوامل الموضعية من الرتبة الأولى ضمن عامل شاملء أو أعلى AS‏ 
والتي تحدد المتغيرات الكامنة التي تمثلها عوامل الرتبة الأولى. على الرغم من أن ا مناقشة 
التالية تفترض وجود نموذج ذي مستويين فقط (أي عوامل متعددة من الرتبة الأولى وعامل 
واحد من الرتبة الأعلى). إلا أنه من الناحية النظرية يمكن أن هتد التسلسل الهرمي ليشمل 
عوامل من الرتبة الثانية كأسباب لعوامل الرتبة الأولى» وعوامل من الرتبة الثالثة كأسباب 
لعوامل من الرتبة الثانية. وهلم جراً. 





شكل )40-1( النموذج الهرمي 
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على الرغم من أن النماذج الهرمية والنماذج ثنائية العوامل قد تبدو متشابهة. حيث 
إن كليهما ينطوي على عوامل شاملة وموضعية. إلا أن هناك فرقًا مفاهيميًا مهكًا؛ إنهما 
يختلفان في مفهوم السببية. في النموذج GIS‏ العواملء يتم تحديد قيمة كل بند بشكل 
مباشر من خلال كل من العامل الخاص والعامل العام بينما في النموذج الهرميء. يكون 
عامل الرتبة الأعلى سببًا لعوامل الرتبة Lal‏ والتي هي بدورها تحدد قيم البنود. ليس 
لعامل الرتبة الأعلى أي تأثير سببي مباشر على قيم البنود. ولكن كل هذا التأثير يتم بوساطة 
عوامل الرتبة الأولى )2010 et al.,‏ ء5ذ). وبالتالي» بينما تكون البنود هي مؤشرات للعامل 
العام في النموذج GLS‏ العواملء فإنه في النموذج الهرميء تكون عوامل الرتبة الأولى هي 
المؤشرات (الكامنة) لعامل الرتبة الأعلى. بالنسبة للنموذج الهرمي من النوع الموضح في 
الشكل رقم )30-1( فإن التحليل الذي يؤدي إلى عامل الرتبة الأعلى سيتضمن خطوتين 
مفاهيميتين: أولاً الحصول على الدرجات المناسبة من خلال التحليل العاملي لعوامل الرتبة 
الأولى (على سبيل JEL‏ لكل عامل من الرتبة الأولى» متوسط قيمة الدرجات التي يتم 
تشبعها (ade‏ ثم إجراء التحليل العاملي على درجات عوامل الرتبة الأولى تلك للحصول على 
تشبعاتها على عامل الرتبة الأعلى. 

هناك مثالان مبسطان» واحد لكل من هذه النماذج التحليلية العاملية الجديدة, 
سيتم تناولهما مما قد يجعل هذه النماذج AST‏ وضوحًا. حيث US‏ اعتبار ما قد يكون 
نموذجًا تحليليًا عاملياً مناسباً؛ Vol‏ لمجموعة من القدرات الرياضية ومن ثم بالنسبة للآراء 
الاجتماعية والسياسية. 


قد يكون لدى الشخص مهارات رياضية Jio dole‏ القوة وخفة الحركة. بالإضافة إلى US‏ 
قد يكون لدى هذا الشخص مهارات خاصة قانمة على ال ممارسة ilo SIS‏ بالأنشطة الرياضية 
الفردية. قد تشمل هذه القدرة على رمي كرة سريعة عبر dog)‏ المنزل home plate‏ في لعبة 
البيسبولء أو ركل كرة القدم من خلال الأعمدة القائمة uprights‏ في كرة القدم الأمريكية, 
أو الإسقاط المباشر لكرة السلة في الهدف من منتصف الملعب. هذه المهارات الأخيرة يتم 
تحديدهها جزئيًا من خلال القدرة الرياضية العامة ولكن يتم تحديدها أيضًا إلى > كبير 
من خلال ممارسة المهارة الخاصة. وبالتالي» لا هكن بالضرورة لأي شخص لديه قوة جيدة 
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وخفة في الحركة أن يرمي كرات سريعة بسرعة 117 ميلاً في الساعة التي كانت باستمرار 
داخل الزاوية تماماً في منطقة ضرب كرة البيسبول. UY‏ إذا كان لدينا قدرٌ ما من مجموعة 
واسعة من المهارات الخاصة مثل قدرة الشخص على رمي ضربات الكرة cde pad!‏ فقد يكون 
من الأفضل وضع نماذج للمؤشرات المقابلة لتلك المجموعة من المهارات باستخدام نموذج 
ثنائي العوامل. هذا النموذج سيمثل كل مهارة كمهارة متأثرة بعامل القدرة الرياضية العام 
وعامل ال ممارسة الخاص باطهارات. Why‏ فإن قيم مؤشر رمي ضربات الكرة السريعة 
ستتأثر بشكل مشترك ب ”القدرة الرياضية العامة“ و”ممارسة الرمي“. لاحظ أن سبب 
”ممارسة الرمي“» العامل الخاص في هذا JEL‏ ليس هو العامل elol‏ «القدرة الرياضية». 
بدلاً من AS‏ يساهم هذان العاملان بشكل مباشر في الاحترافية في رمي الكرة السريعةء 
ويوضح هذا الشكل رقم .(V1-1)‏ البنود A‏ و8 و0 ناتجة مباشرة عن كل من ”ممارسة 
الرمي“ و”القدرة الرياضية“. علاوة على ذلكء بعد ISM‏ في الحسبان ”القدرة الرياضية“ 
dels!‏ فإن البنود التي تمثل ”ممارسة الرمي“ هي في الأساس أحادية adl‏ وبالتالي هكن 
أن تكون مناسبة للاندماج في مقياس. بشكل أساسيء فإن بنود ”ممارسة الرمي“ هي 
مجموعة أحادية البعد مندرجة ضمن النموذج الأوسع. 

في حالات أخرىء سيكون النموذج الهرمي مناسبًا لبياناتنا أفضل من النموذج GUS‏ 
العوامل. لنفترض الآن أن مشكلة القياس التي نواجهها هي تحديد نموذج عاملي مناسب 
ممجموعة من مؤشرات وجهات النظر الاجتماعية والسياسية. قد تطلب البنود من المجيبين 
الإشارة إلى شعورهم تجاه سياسات الإنفاق الحكوميء مثل الدعم SUI‏ لبرامج الفقر أو 
الشركات dp seal!‏ وكيف ينظرون إلى القضايا الاجتماعية للاختيار الشخصي مثل زواج 
المثليين أو ملكية السلاح. 
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الفصل السادس 


ممارسة الرمي 


Pitching 
Practice 


ممارسة الركل 
Kicking‏ 
Practice‏ 


ممارسة الرماية 
Shooting‏ 
Practice‏ 











شكل )11-1( نموذج GLI‏ العوامل ل ”القدرة الرياضية“ 


كل فئة من فئات سياسة الإنفاق والقضايا الاجتماعية قد تحتوي على عدة بنود تمثل 
حالات dole‏ لتلك المتغيرات. قد يكشف التحليل العاملي الأولي لهذه البنود المختلفة عن 
عاملين (من الرتبة الأولى) يشير محتواهما إلى أن أحدهما يستعرض وجهات النظر حول 
سياسات الإنفاق والآخر يستعرض ال معتقدات حول الخيارات الشخصية. علاوة على WS‏ 
على الرغم من أن النتائج قد تشير إلى أن هذه العوامل متمايزة بوضوح. إلا أنها قد ترتبط 
ببعضها البعض. قد يستنتج الباحث أنه بالإضافة إلى العاملين الأماسيين الخاصينء هناك 


= تطوير المقاييس: النظرية والتطبيق 


التحليل العاملي 


عامل سببي أعلى رتبة مثل ”الليبرالية / امحافظة“ التي تحدد آراء المجيبين بشأن كل من 
سياسات الإنفاق والقضايا الاجتماعية. Why‏ فإن ”الليبرالية / المحافظة“ هي عامل 
محدد في وجهات النظر loud‏ يتعلق بكل من سياسات الإنفاق والقضايا الاجتماعيةء ووجهتا 
النظر المحكمة هما المحددان الفوريان للاستجابات للبنود الفردية. لاحظ أن ”الليبرالية / 
المحافظة“ ليست سببًا مباشرًا للاستجابات ogi‏ على سبيل ال مثال» قد يكون لبعض الأفراد 
الذين يعتبرون محافظين أو ليبراليين بشكل عام آراء حول القضايا الخاصة قيد النظر والتي 
تتعارض مع آراء معظم الليبراليين أو المحافظين. (مثال ملموس على ذلك هو أعضاء إدارة 
الرئيس الأمريكي ريجان المحافظة بشكل خاص» الذين & يشاركوا آراء معظم المحافظين بعد 
محاولة اغتيال الرئيس فيما يتعلق بالسيطرة على الأسلحة). وعندما يكون الأمر MIS‏ 
فإن العامل الثانوي البعد لن يكون لديه تأثير سببي كبير على الاستجابات لجميع البنود. 
أي إن SWI‏ السببي للعامل الثانوي على استجابات البنود يتم بوساطة العامل الأساسي 
بدلاً من أن يكون مباشرًا. الترتيب المفاهيمي لهذه المتغيرات» مع تدفق السببية من عامل 
من الرتبة ASW!‏ إلى عامل من الرتبة الأولى» إلى البنودء يلائم نموذج تحليل العوامل الهرمي 
(انظر الشكل رقم OV-T‏ 

الغرض الأساسي من استخدام نهج النموذج ثنائي العوامل أو النموذج الهرمي لتحليل 
العوامل هو الكشف عن الأبعاد الكامنة المتعددة التي تمتلكها بعض البيانات وتحديد 
مجموعات البنود ذات البعد الأحادي بشكل أساسي. النموذج ثنائي العوامل مفيد بشكل 
خاص في هذا الصدد للعديد من أنواع المتغيرات التي تمثل مؤشراتها مفهوماً construct USL,‏ 
أكثر عمومية ومفاهيم بنائية متعددة أكثر خصوصية. يتيح نهج gògail‏ ثنائي العوامل 
للفاحص بشكل أساسي أن يضع العامل العام Lile‏ ثم يدرس إلى أي مدى ينتج فعل ذلك 
مجموعات بنود أحادية البعد. 


تطوير المقاييس: النظرية والتطبيق yoo‏ 


الفصل السادس 








شكل OV)‏ النموذج الهرمي للآراء السياسية والاجتماعية 


ومع JS‏ هذا الحل Y‏ يخلو من المضاعفات والقيود. على سبيل JELI‏ ستظل 
الاستجابات المشاهدة ogi‏ تحتوي على تباين من كل من العوامل ال مشتركة والعوامل 
الخاصة. وبالتالي» من المرجح أن تؤدي التقييمات البسيطة للثبات التي لا تأخذ بالحسبان 
هيكلية النموذج GLI‏ العوامل إلى المبالغة في تقدير OLY!‏ في الواقع» كما أشار ريس 
وآخرون )2010 (Reise et al.,‏ أن كثيراً من الثبات الظاهر قد ينشأ عن العامل اممشترك أكثر 
من العامل الخاص» حتى بالنسبة للبنود التي تشكل عاملًا خاصاً. وبالتالي» يجب اختيار 
تقديرات الثبات التي تعكس Bay‏ هيكل النموذج ثنائي العوامل للبيانات. 
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التحليل العاملي 


Lai‏ كما Bed‏ ريس وآخرون »)۲١٠١(‏ أن الحزم الإحصائية التقليدية للتحليل العاملي 
المعدة للنماذج بسيطة الهيكل تؤدي عملاً ضعيفاً في تحديد وجود عامل عام مصحوب 
بعوامل خاصة. Why‏ يجب على الباحثين استخدام goliy‏ مخصص صراحة لتحليل 
النموذج ثنائي العوامل (مثل الحزمة Psych‏ ضمن بيئة تحليل البيانات (R‏ لاستكشاف 
البيانات التي تناسب هذا النموذج (انظر 2010 Reise et al.,‏ للحصول على مزيد من 
التفاصيل حول حزم البرامج المناسبة). يمكن أن تكون هذه التحليلات معقدة إلى حد ما 
وتستفيد من خبرة الباحث وحكمه. العديد من الباحثين غير المختصين في القياس النفسي 
قد يختار بحكمة عدم محاولة إجراء تحليلات ثنائية العوامل دون توجيهات إرشادية من 
الخبراء. ومع ذلك من المفيد لجميع الباحثين المشاركين في القياس أن يكونوا على دراية 
بهذه الامتدادات من التحليل العاملي - وخاصة نموذج ثنائي العوامل - لأنها قد توفر بدائل 
مفيدة لنماذج الهيكل البسيط لتحقيق أحادية البعد الأساسية. 


تفسير العوامل: 

في ULL‏ الذي يتضمن بنود «الوعي» و«الاعتمادية» افترضنا أننا نعرف Labs‏ بالضبط ما 
هي المتغيرات الكامنة. في كثير من الأحيانء ليس هذا هو الحالء وحينئذ سوف نعتمد على 
التحليل العاملي لإعطائنا دلالات Glin‏ طبيعة تلك المتغيرات الكامنة. ويتم ذلك عن طريق 
فحص البنود التي تمثل بقوة كل عامل (على سبيل JEL‏ البنود التي تحتوي على أكبر 
تشبعات على عامل معين). البنود GIS‏ التشبعات الأكبر هي تلك الأكثر تشابهًا مع المتغير 
الكامن Why)‏ ترتبط بقوة أكبر). MY‏ يمكن أن توفر نافذة للتعرف على طبيعة العامل 
المعني. يتم القيام بذلك بسهولة عندما يكون هناك العديد من البنود التي تطرأ بوضوح 
على أحد المتغيرات العامة GIS‏ التشبعات الكبيرة (على سبيل SEB‏ أكبر من 0,70) على 
نفس العامل. بالعودة إلى مثال الخصائص التي تعتبر مهمة لدى زميل العملء إذا كانت 
الخصائص “SS”?‏ و”لديه ذاكرة حديدية“ و”متعلم بشكل “Sue‏ وربما بند أو بندين آخرين 
ذات الصلة بالقدرة الفكرية تتشبع كلها بشكل كبير على نفس العامل» مع عدم وجود بنود 
لها تشبعات كبيرة على هذا العاملء فإنه سيكون من السهل إلى حد ما استنتاج أن ”الأهمية 
ا منسوبة إلى العقل“ أو وصف ما مكافن كانت تسمية ملانمة لهذا العامل. 
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الفصل السادس 


على الرغم من أن اختيار تسمية لعامل ما قد يبدو واضحًا في بعض الحالات» فإن تعبين 
اسم لا يختلف عن إثبات الصدق validity‏ إذا كانت مجموعة البنود تستمر في الأداء 
كما يوحي الاسم المعينء فإنه سيتحدد الصدق في النهاية. عندما تفسر العوامل تبايئًا قليلا 
نسبيًا ولديها بنود متعددة ومتباينة ظاهرياً وتتشبع على نحو مماثل» فإنه يجب أن يكون 
محلل العوامل حذرًا بشكل خاص في التفسير. إذا أسفر التحليل عن عامل واحد ببنود تبدو 
مختلفة» فمن الأفضل عدم أخذ هذا العامل على محمل الجد كمؤشر على متغير كامن. 

هناك نقطة أخرى تستحق أن نتذكرها في مرحلة التفسير وهي أن التحليل العاملي 
يمكن أن يعثر على البنية أو الهيكل التي تأخذ بالحسبان العلاقات فقط بين البنود الي تم 
تحليلها - لن تكشف بالضرورة عن طبيعة الظواهر في حد ذاتها. لا يمكن للباحث الذي 
يحاول تحديد الأبعاد الأساسية للشخصية: على سبيل Jt‏ الحصول على عامل ”الانفتاح“ 
إذا م يتم تضمين أي بنود متعلقة بالانفتاح. 

في بعض Le‏ يمكن أن يؤدي Quad‏ عبارة أو جملة معينة إلى حدوث مظهر Gb‏ 
لعامل ذي مغزى مفاهيمي. عندما تتم صياغة بعض العبارات بصيغة المتكلم (أناء نحن») 
والبعض الآخر بدونء على سبيل SUA‏ فإن ذلك قد يفسر مط الارتباطات التي تمت 
مشاهدتها. كتوضيح, خذ بعين الاعتبار البنود الافتراضية التالية: : 
-١‏ أنا أحب التفاح. 
-Y‏ للبرتقال طعم جيد. 
-Y‏ أنا Ladi‏ التفاح على بعض الفواكه. 
-E‏ هناك العديد من الأشخاص الذين يحبون البرتقال. 
0- أنا أستمتع بالتفاح بين الحين والآخر. 
3- البرتقال legos‏ رائحته لطيفة. 
۷- أنا أجد هشاشة التفاح جذابة. 
-A‏ يمكن أن يكون البرتقال الطازج حلوى لذيذة. 

إذا كانت البنود الفردية يتم تشبعها على عامل واحد والبنود الزوجية على عامل ثانء 
فلن نعرف ما إذا كانت الصياغة «أنا» للبنود الفردية هي سبب العاملين أو إذا كان الناس 
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التحليل العاملي 


يعبرون عن مواقف متباينة تجاه النوعين من الفاكهة المذكورة. كل التفسيرات معقولة 
ولكن مربكة. هذه هي الحالة التي قد نقارن أو لا نقارن بها التفاح بالبرتقال. 


طريقة المكونات الرئيسية مقابل العوامل المشتركة: 

هناك فئتان عريضتان من أساليب تحليل البيانات التي يعتبرها بعض المؤلفين أساساً 
نفس الشيء لكن آخرين يرون أنها مختلفة Bris!‏ جذريًاء هما التحليل العاملي وتحليل 
المكونات الرئيسية. أحيانًا يستخدم مصطلح التحليل العاملي لاحتضان LIS‏ التقنيتين وفي 
أحيان أخرى لوصف أحدهما على عكس الآخر. DE‏ ما تستخدم مصطلحات العوامل 
امشتركة common factors‏ والمكونات components‏ كوسيلة أقل غموضًا للإشارة بشكل 
خاص إلى ال مركبات الناشئة عن التحليل العاملي وتحليل المكونات الرئيسية» على التوالي. 
هناك أساس لتأكيد كل من التشابه والاختلاف بين هذه الأساليب. 

تحليل المكونات الرئيسية تنتج واحداً أو أكثر من المتغيرات المركبة التي تلتقط الكثير 
من المعلومات ال موجودة أصلاً 2 مجموعة أكبر من البنود. علاوة على US‏ يتم تعريف 
المكونات على أنها مجاميع doe yo‏ للبنود الأصلية. أي إن المكونات الرئيسية هي تحويلات 
خطية للمتغيرات الأصلية. إنها تتجذر في البيانات الفعلية وتستمد من البنود الفعلية. إنها 
مجرد إعادة تنظيم للمعلومات في البنود الفعلية. 

تحليل العوامل المشتركة ينتج LÉ‏ واحداً أو أكثر من المتغيرات المركبة التي تلتقط 
الكثير من اممعلومات الموجودة Mol‏ في مجموعة ST‏ من البنود. ومع US‏ تمثل هذه 
ا مركبات المتغيرات الافتراضية. ولأنها افتراضية» كل ما يمكننا الحصول عليه هو تقديرات 
لهذه المتغيرات. العامل ا مشترك هو مفهوم بنائي مثالي تخيلي الذي افتراضياً يسبب البنود 
المراد الإجابة عليها كما هي؛ ويتم الاستدلال على طبيعة المفهوم البنائي من خلال دراسة 


هل هما نفس الشيء أم مختلفان؟ 
يوضح الوصف أعلاه بعض الاختلافات بين المكونات والعوامل. أحد هذه الاختلافات هو 
أن العوامل تمثل متغيرات افتراضية مثالية نقدرهاء بينما المكونات هي أشكل بديلة للبنود 
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الأصلية من خلال ربط معلوماتها. الفكرة وراء استخراج العوامل المشتركة هي أنه يمكننا 
إزالة التباين من كل بند لا يشترك مع أي من البنود الأخرى. من منظور التحليل العامليء كما 
كان الحال مع LUI‏ فإن التباين غير المشترك هو Las‏ في الأساس. وبالتاليء فإن التركيبات 
التي توصلنا إليها في استخراج العوامل المشتركة هي تقديرات للمتغيرات الافتراضية, الخالية 
من الأخطاء. وبهذا المعنى» تكون العوامل المشتركة مثالية - إنها تقديرات طا قد يبدو 
عليه متغير خال من الأخطاء يحدد مجموعة من البنود. علاوة على EUS‏ تحدد العوامل 
كيف تتم الإجابة على البنود في حين يتم تعريف المكونات من خلال LS‏ الإجابة على 
البنود. وبالتاليء في تحليل المكونات الرئيسية»ء تعتبر المكونات منتجات نهائية gil‏ وتحدد 
الدرجات الفعلية التي تم الحصول عليها من البنود طبيعة المكونات. بينماء في تحليل 
العوامل المشتركة فإننا نستحضر مفهوم المتغير الافتراضي المثالي الذي هو سبب درجات البند. 
العامل هو تقدير لهذا المتغير الافتراضي وهثل Caw‏ وليس AST‏ لدرجات البنود. 


ماذا عن أوجه التشابه؟ هناك العديد: 

Vol‏ الفرق الحساي بين الاثنين ضئيل. تذكرء في تحليل العوامل المشتركة, أن الهدف 
هو تقدير متغير مثالي خال من الأخطاء. ولكن يجب علينا إنشاء هذا التقدير من البيانات 
الفعلية. كما أشرناء تعتمد الطرق التحليلية للعوامل بشكل عام على مصفوفة الارتباط 
التي تمثل جميع الارتباطات بين البنود التي يجب أن تحلل إلى عوامل. في الفصل ĊJU‏ 
أشرت إلى أن جميع القيم غير القطرية في مصفوفة التغاير أو الارتباط لا تمثل سوى التباين 
المشترك» الشيوعي communal‏ كما أشرت NLT‏ أن مصفوفة الارتباط هي مجرد نسخة 
معيارية standardized‏ من مصفوفة التباين - التغاير .variance-covariance matrix‏ 
الارتباطات نفسها هي تغايرات معيارية» والوحدات unities‏ هي تباينات معيارية للبنود. 
كل تباين معياري لبند يمثل كافة التباينء المشترك والخاص unique‏ الذي يظهره البند. 
لإنشاء متغير مثالي خال من الأخطاء» يجب إزالة الجزء الخاص من التباين الموجود في تباينات 
الننوة. على طول القظر الركيدي giak‏ الارضباط: وبشكل أكثر nes‏ يجب استبدال كل 
وحدة unity‏ بتقدير الشيوع communality‏ وهي قيمة أقل من ٠,٠‏ تقارب فقط التباين 
المشترك لمتغير معين مع المتغيرات الأخرى المدرجة في التحليل العاملي. على سبيل JEL!‏ 
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إذا قدرنا أن هناك متغيرًا معينًا يشارك XEO‏ من إجمالي تباينه مع بنود أخرى في مصفوفة 
الارتباطء فسنحدد له تقديرًا مشتركًا (الشيوع) بقيمة ٠,٤١‏ ونضع تلك القيمة في ا مصفوفة, 
مع استبدال الرقم ٠,١‏ الذي Éo‏ التباين الكلي للبند. سنفعل ذلك لكل متغير. مع استبدال 
كل وحدة بتقدير الشيوع؛ HIE)‏ يتم الحصول على تقديرات الشيوع عن طريق انحدار 
المتغير المعني على جميع المتغيرات المتبقية وذلك للحصول على مربع الارتباط المتعدد, 
R?‏ الذي يقوم بدور التقدير). تنتج عملية التصفية هذه مصفوفة ارتباط معدلة يتم 
استخدامها لاستخراج العوامل المشتركة بدلاً من المكونات» كما هو مبين في الجدول رقم 
.)١1-1(‏ التعويض بتقديرات الشيوع عن الوحدات 1121665 هو الفرق الحسابي الوحيد الذي 
يميز استخراج العوامل المشتركة عن استخراج المكونات الرئيسية. 


جدول :)١-5(‏ مصفوفتا الارتباط لتحليل المكونات الرئيسية والتحليل العاملي المشترك 















































ملاحظة: مصفوفة الارتباط في الأعلى» والتي تُستخدم لتحليل المكونات الرئيسية, تحتفظ 
بالوحدات في القطر الرئيسي. بينما تحتوي مصفوفة الارتباط في الأسفلء والتي تستخدم 
للتحليل العاملي eth!‏ على تقديرات الشيوع» بدلاً من الوحدة, على طول القطر الرئيسي. 
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ماذا عن قضية السبب والأثر؟ نحصل على كل من العوامل والمكونات من خلال تحليل 
الدرجات على البنود المشاهدة. كما يوضح شرح تقديرات الشيوع., فإن العلاقات التجريبية 
بين البنود هي في النهاية أساس العوامل المشتركة. وهذاء بالطبع. صحيح أيضًا بالنسبة 
للمكونات. Lue WU‏ كلاهما يرتكز على البيانات التجريبية. علاوة على EUS‏ فإن 
معظم محللي البيانات يصورون WS‏ من المكونات والعوامل المشتركة كطرق لفهم المتغيرات 
الكامنة لمجموعة من البنود. وهذا يعني أن US‏ من المكونات والعوامل يُعتقد Bole‏ أنها 
تكشف سبب الدرجات المرصودة ممجموعة من البنود. في الواقع» يستخدم تحليل المكونات 
وتحليل العواملء بالتبادل؛ حيث إنه في معظم الحالات التي تكون فيها البنود لديها شيء 
مشترك Line gd‏ فإن الطرق المختلفة تدعم نفس الاستنتاجات. في العديد من برمجيات 
تحليل العوامل (مثل PROCFACTOR‏ في الحزمة الإحصائية (SAS‏ يكون تحليل ا مكونات 
الرئيسية هو الافتراضي. معنى» يتم الاحتفاظ بالوحدات في مصفوفة الارتباط ما لم يتم 
تحديد الشيوع. dU‏ على الرغم من أن هناك أوجه تشابه واختلاف بين الاثنينء إلا أن التمييز 
بينهما le We‏ يتم تجاهله مع وجود ous‏ قليل إن وجد من الآثار السلبية. 

ومع US‏ فإن أحد الاختلافات dagh!l‏ هو طبيعة التباين التي تفسرها المكونات مقابل 
العوامل. تأخذ المكونات في الحسبان الجزء المحدد من التباين الكلي بين المتغيرات الأصلية, 
في حين أن العوامل تأخذ في الاعتبار التباين المشترك أو الشائع. إن تقليل القيم القطرية 
ممصفوفة الارتباطء كما يفعل الشخص عند استخراج العوامل AS REL!‏ يقلل من البسط 
والمقام للنسبة التي تعبر عن نسبة التباين. لكنه يقلل من المقام إلى درجة أكبر بسبب 
الحسابات المحددة التي ينطوي عليها حساب الفروق GIS‏ الصلة. ونتيجة UU‏ فإن نسبة 
التباين التي تفسرها مجموعة من المكونات والعوامل القابلة للمقارنة لن تكون متساوية 
أو مكافئة من الناحية النظرية. سوف تفسر العوامل نسبة أكبر من التباين الأكثر تقييدًا 
(أي التباين (IR ALI‏ بينما تفسر المكونات نسبة أصغر من التباين الكلي. عند مناقشة 
النتائج التحليلية للعوامل وتقديم تقرير عن نسبة التباين المفسّر بالعوامل» فإنه من الأهمية 
مكان أن نكون واضحين بشأن نوع التحليل (المكونات أم العوامل المشتركة)» وبالتاليء نوع 
التباين (المشترك أو الإجمالي) الذي يتم تفسيره. 

هناك اختلاف آخر جدير بالملاحظة وهو أنه في بعض الحزم الإحصائيةء فإن بعض 
المخرجات التي يتم الحصول عليها من استخراج العوامل ا مشتركة ستبدو بلا معنى. 
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في كلا النوعين من التحليلء Gow‏ يتزايد المقدار التراكمي للتباين المفسر كلما تم استخراج 
العامل/المكون التالي. في العوامل المشتركة, غالبًا ما تتجاوز هذه النسبة ٠,١‏ في مرحلة ماء 
وتستمر في الارتفاع مع إضافة العوامل AW‏ وبعد ذلك كما لو كان الأمر سحراً تعود 
القيمة إلى ٠١‏ تماماً عند استخلاص العامل K”‏ على الرغم من أن هذا يبدو غريباً إلا أنه 
مجرد نتيجة ملفقة iih)‏ حساب ويمكن تجاهلها. إذا استخدم محلل البيانات معايير 
معقولة لتحديد عدد العوامل التي يجب استخراجهاء فإن العدد المختار سوف يسبق Bole‏ 
النقطة في تسلسل الاستخراج Cus‏ تنشأ هذه الحالة الشاذة. ومع US‏ فمن الممكن لهذا 
العدد المحدد من العوامل أن يفسر تقريبًا كل (أي ++ (ZV‏ التباين المشترك بين البنود الأصلية. 


:Confirmatory Factor Analysis التحليل العاملي التوكيدي‎ 


التفرع الآخر لأساليب تحليل العوامل بميز بين الطرق الاستكشافية والتوكيدية. تشير 
هذه المصطلحات في الأصل إلى نية محلل البيانات بدلاً من الطريقة الحسابية. Yibo‏ 
يمكن استخدام نفس التحليل على نفس المجموعة من البنود Le]‏ لتحديد بنيتها الأساسية 
(الاستكشافية) أو لتأكيد نمط معين من العلاقات المتوقعة على أساس نظرية أو نتائج 
تحليلية سابقة (توكيدية). مع التكرار bibl‏ تستخدم هذه ال مصطلحات الآن للتمييز بين 
أنواع مختلفة من الأدوات التحليلية بدلاً من الأهداف البحثية المختلفة. عندما يستخدم 
الأفخاص مصطلح التحليل العاملي التوكيديء فإنهم يتحدثون WE‏ عن طرق قائمة على 
نمذجة المعادلة البنائية „structural equation modeling (SEM)‏ وعلى الرغم من 
أنه يجب استخدام هذه الأساليب بالطريقة التوكيدية Yay‏ من ABLES!‏ إلا أنه هكن 
استخدام الأساليب القياسية التحليلية للعوامل GV‏ منهما. وبالتالي» فإن كلمة ”التوكيدية“ 
لا تعني بالضرورة نظام SEM‏ 

ومع US‏ فإن الأساليب ا مستندة إلى نمذجة المعادلات البنائية SEM‏ تقدم بعض الفوائد 
الحقيقية التي تتميز بها على الأساليب التقليدية لتحليل العوامل في بعض الحالات. وتبرز 
هذه الفوائد GY‏ نماذج SEM‏ مرنة للغاية. الشروط التي يتم افتراضها بواسطة أساليب 
تحليل العوامل التقليدية» Jio‏ استقلالية حدود الخطأ للبنود عن ass‏ البعضء يمكن 
تغييرها بشكل GES!‏ في الأساليب المستندة إلى LUIS SEM‏ فإن الطرق التقليدية تقيد 
محلل البيانات إما بالسماح للعوامل بالترابط مع بعضها البعض أو تتطلب أن تكون جميعها 
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مستقلة عن بعضها البعض. الأساليب القائمة على SEM‏ همكنها أن تجمع بين العوامل 
المترابطة وغير المترابطة إذا كانت النظرية تشير إلى أن مثل هذا النموذج ينطبق. 

يمكن للطرق القانئمة على نمذجة المعادلات البنائية SEM‏ أيضًا توفير معيار Glas]‏ لتقييم 
مدى ملاءمة البيانات الحقيقية للنموذج المحدد. إن استخدامها بحكمة وترويء يجعلها من 
الممكن أن تكون Sei‏ ولكن في بعض GLEN‏ هكن أن يؤدي ذلك إلى المبالغة في استخراج 
العوامل. حيث يؤدي استخراج المزيد من العوامل في كثير من الأحيان إلى تحسين ملاءمة 
النموذج. إن تطبيق معيار ajlo Glas]‏ قد يحجب حقيقة أن بعض العوامل ذات الأهمية 
الإحصائية قد تمثل نسبًا صغيرة غير مثيرة للاهتمام من التباين. خاصة في المراحل المبكرة 
من تطوير الأداةء قد يكون هذا مخالفاً لأهداف الباحث الذي يهتم بإيجاد أصغر oue‏ من 
العوامل المشبعة بالمعلومات بدلاً من حساب أكبر قدر ممكن من التباين. 

وميزة أخرى تتوفر في الأساليب المعتمدة على نمذجة المعادلات البنائية SEM‏ وهي 
او او التماذع البديلة وان eis‏ ماد انات مرة أخرى, 
إن استخدامها بحكمة» يجعلها من ا ممكن أن تكون أداة قيمة. وعلى العكس من ذلك 
إن استخدامها loeb‏ قد تؤدي إلى الوصول إلى نموذج ذي مواصفات أقل منطقية من 
الناحية النظرية ولكنها تؤدي إلى نموذج أفضل ملاءمة من الناحية الإحصائية. على سبيل 
ا مشال» قد تؤدي إزالة القيد المتمثل في عدم ارتباط أخطاء البنود مع بعضها البعض إلى 
ظهور قيم صغيرة جدا للارتباطات» ولكن قد لا يزال النموذج يتفوق من الناحية الإحصائية 
على نموذج مقيد. قد يقرر أحد الباحثين تجاهل الارتباطات الصغيرة لصالح نموذج أكثر 
بساطة. بينما يتم إقناع آخر بمعيار flas‏ لرفض البديل الأكثر بساطة. كمثال آخرء قد 
يكون النموذج الذي يفصل بين اثنين من العوامل المتمايزة ولكن مترابطة للغاية Ley)‏ مثل 
”الوعي“ و”الاعتمادية“) أفضل من النموذج الذي يربط بين الاثنين. إذا كان الارتباط بينهما 
Jur We‏ فقد يبدو قرار إبقائهم منفصلين تعسفيًا. على سبيل JUI‏ يمكن اعتبار الارتباطه 
لنقل t AO‏ بين مؤشرين لنفس اطفهوم البنائي construct‏ دللا جيدًا على تكافؤهما. لکن 
النموذج الذي يصف العوامل ال منفصلة التي ترتبط مع بعضها البعض مقدار ٠,10‏ قد 
يناسب البيانات بشكل أفضل من النموذج الذي يجمع الاثنين في عامل واحد. 

وليس المقصود من هذه التعليقات أن تشير إلى أن الطرق LEW‏ على نمذجة المعادلات 
البنائية SEM‏ للتحليل العاملي التوكيدي هي سيئة. قدم ظهور هذه الأساليب مساهمات 
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هائلة لفهم مجموعة متنوعة من قضايا القياس. ومع EUS‏ أعتقد أن المرونة المتأصلة في 
هذه الأساليب تخلق فرصًا أكثر لاتخاذ قرارات رديئة» خاصة عندما لا يكون محلل البيانات 
على دراية بهذه الأساليب. مع استثناء محتمل لتحليل المكونات الرئيسية (حيث تكون 
العوامل عبارة عن مركبات خطية في البنود)» لا توجد طريقة لتحليل العوامل تنتج حلاً 
صحيخًا فريدًا. هذه الأساليب تنتج فقط حلولاً معقولة, والتي قد يكون هناك الكثير 
منها. ليس هناك ما يضمن أن النموذج الأكثر تعقيدًا الذي يتفوق Blac!‏ على نموذج 
أبسط بديل هو انعكاس أكثر دقة للواقع؛ قد يكون أو لا يكون. مع كل الأساليب التحليلية 
للعواملء هناك dele‏ إلى المنطق السليم لاتخاذ أفضل القرارات. التحليلات هي مجرد 
إرشادات لعملية صنع القرار وأدلة لدعم تلك القرارات. لا ينبغي لتلك التحليلات» في رأيي» 
أن تحل بالكامل محل gio‏ قرار الباحث. da‏ من المهم أن يتم وصف أساس القرارات» 
إحصائية أو غير WS‏ بدقة في التقارير المنشورة عن التحليل العاملي التوكيدي. 

ملاحظة أخيرة حول هذا الموضوع: يعتبر الباحثون في بعض مجالات الاستقصاء (مثل 
أبحاث الشخصية) أن الحصول على نتائج متسقة من أساليب تحليل العوامل التقليدية 
كدليل تأكيدي أقوى من إظهار نموذج جيد ملائم pleb Lady‏ إحصائية. على سبيل 
JELI‏ ذكر )1996( Saucier and Goldberg‏ أنه ”نظرًا OY‏ التحليل العاملي الاستكشافي 
يوفر اختبارًا أكثر دقة للتكرار من التحليل العاملي التوكيديء فقد يكون التحليل العاملي 
الاستكشافي غالبًا مفضلاً على التحليل العاملي التوكيدي“ (PO Yo)‏ السبب هو أنه إذا كانت 
البيانات المأخوذة من عينات مختلفة من الأفراد في مناسبات مختلفة قد أسفرت عن نتائج 
تحليلية للعوامل متطابقة بشكل أساسي باستخدام الأساليب الاستكشافيةء فإن احتمال أن 
تكون هذه النتائج عبارة عن صدفة متكررة ضئيل للغاية. تذكر أنه في الأساليب ال مستندة 
إلى SEM‏ لهذا الموقف duds‏ يحدد محلل البيانات العلاقات المتوقعة بين المتغيرات ويحدد 
برنامج الكمبيوتر ما إذا كان يمكن مطابقة هذا النموذج مع البيانات التجريبية empirical‏ 
ing‏ آخرء يُعطى الكمبيوتر yall‏ كبيراً حول الطريقة التي يجب أن تصير عليها الأمور. 
في «Llib!‏ فإن bole]‏ اكتشاف هيكلية سابقة للعوامل دون اللجوء إلى مثل هذه التلميحات» 
كما قد يحدث مع التحليلات الاستكشافية dy Schl‏ يمكن أن تكون مقنعة للغاية. 
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استخدام التحليل العاملي في تطوير المقاييس: 

يجب أن يجعل ال مثال التالي بعض المفاهيم التي تمت مناقشتها في هذا الفصل أكثر 
واقعية. طور بعض الزملاء وأنا (DeVellis et al.,1993)‏ مقياسا لتقييم معتقدات الآباء 
بشأن من أو ماذا يؤثر على صحة أطفالهم. على الرغم من أن المقياس يحتوي على ١‏ بنداً 
ويقيم العديد من جوانب هذه المعتقداتء إلا أنه بالنسبة لهذا العرض التقديميء سأناقش 
فقط fus ١١‏ من تلك البنود: 
4- لدي القدرة على التأثير على رفاهية طفلي. 
8- ما إذا كان طفلي يتحنب الإصابة هو مجرد حظ. 
-C‏ يلعب الحظ دورًا HS‏ في تحديد مدى صحة طفلي. 
LS -D‏ أن أفعل الكثير لحماية طفلي من الأذى. 
-E‏ يمكنني أن أفعل الكثير لحماية طفلي من المرض. 
-F‏ ما إذا كان طفلي يتجنب المرض هو مجرد مسألة حظ. 
-G‏ الأشياء التي أقوم بها في المنزل مع طفلي جزء مهم من رفاهيته. 
-H‏ سلامة طفلي تعتمد علي. 
-I‏ يمكنني أن أفعل الكثير لمساعدة طفلي على البقاء معاق. 
-J‏ الصحة الجيدة لطفلي هي إلى حد كبير مسألة حسن حظ. 
-K‏ يمكنني أن أفعل الكثير لمساعدة طفلي على أن يكون Ga‏ وصحيحاً. 
-L‏ سواء كان طفلي بصحة جيدة أو مريضاً هي مجرد مسألة قسمة ونصيب. 

تم تطبيق هذه البنود على ۳۹١‏ من الآباء والأمهات» وتم تحليل البيانات الناتجة باستخدام 
التحليل العاملي. كان الهدف الأول من تحليل العوامل هو تحديد عدد العوامل الكامنة وراء 
هذه البنود. وقد تم استخدام SAS goly‏ لإجراء التحليل العامليء وتنفيذ رسم الحصاة 
.scree plot‏ يَظهر رسم الحصاة - مشابهاً للنوع g gabl‏ بواسطة SAS‏ - أدناه (انظر الشكل 
رقم (A-T‏ لاحظ أنه تم رسم gi) Sele ١١‏ ما يصل إلى عدد البنود)؛ومع dogs AS‏ ۲ 
من هذه العوامل على الجزء الأولي من الرسم والباقي يشكل الحصاة التي تمتد على طول 
قاع الرسم. هذا يشير بقوة إلى أن ۲ من العوامل مسؤولان عن الكثير من التباين بين البنود. 
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بعد تحديد عدد العوامل التي يجب الاحتفاظ بهاء نقوم بإعادة تشغيل البرنامج الذي 
يحدد عاملين وتدويرهما بشكل متعامد (التباين الأعظم .(varimax‏ لو فشلنا في تقريب 
الهيكل البسيطء لقمنا بإجراء الدوران المائل oblique‏ لتحسين الملاءمة بين البنود والعوامل. 
ومع EUS‏ في هذه dled!‏ أسفر الدوران المتعامد الأكثر بساطة عن مجموعات بنود ذات 
معنى لا لبس فيها وتشبعات قوية. وهذا يظهر جلياً في جدول تشبعات العوامل» كما هو 
موضح في الجدول رقم (1-؟). يحتوي JS‏ صف على تشبعات بند معين على العاملين. وقد 
قام أحد الخيارات المتاحة في برنامج SAS‏ بإعادة ترتيب البنود ال موجودة في الجدول بحيث 
يتم تجميع البنود GIS‏ التشبعات العالية على كل عامل Lee‏ 


في هذا الجدول. تم وضع خط تحت تشبعات البنود على العوامل التي تزيد عن £1509 
يتم تعريف كل عامل بالبنود التي يتم تشبعها عليه بشكل كبير (أي البنود التي تحتها 
(bs‏ بالرجوع إلى محتوى تلك البنودء يمكن للمرء أن يميز طبيعة المتغير الكامن الذي 
يمثله كل عامل. في هذه الحالةء فإن جميع البنود التي يتم تشبعها بقوة على العامل ١‏ تهم 
الوالد باعتباره عاملاً مؤثراً على ما إذا كان الطفل يبقى آمئًا وصحيحاً. 
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جدول (V-I)‏ تشبعات البنود على العاملين 


الفصل السادس 



































ga Rotated Factor Pattern 
العامل1 البتود‎ Factor 1 العامل2‎ Factor 2 
Item I —.78612 — .22093 
Item K — .74807 —.18546 
Item D — .71880 — .02282 
Item E — 65897 - 2 
Item G — 4 - 9 
Item A — 59749 —.14053 
Item H — 51857 — .07419 
Item F - 8 — 82181 
Item J — 713 — .78587 
Item C — 07773 — .75370 
Item L — 8 — .73783 
Item B —.11609 — 63583 








بينما تلك البنود التي تتشبع في المقام الأول على العامل Y‏ تتعلق بتأثر الحظ أو القدر على صحة الطفل. 

هاتان المجموعتان المتجانستان من البنود يمكن دراستهما بشكل AST‏ على سبيل SEL‏ 
يمكن حساب ألفا لكل مجموعة. حساب Wi‏ لمجموعات البنود هذه باستخدام برنامج 
SAS‏ ينتج المعلومات الموضحة في الجدول رقم (7-7). كلا المقياسين يحتوي على معاملات 
Wi‏ للثبات بشكل مقبول. لاحظ أن الإجراء SAS CORR‏ يحسب WÍ‏ للبنود غير المعيارية 
والمعيارية. يكافئن حساب ألفا للبنود المعيارية استخدام صيغة ألفا المستندة إلى الارتباط. 
لكلا ا مقياسين» تسفر هاتان الطريقتان لحساب ألفا عن قيم متشابهة تمامًا. لاحظ Las)‏ أنه 
لن تزيد قيمة Wi‏ بإسقاط أي من البنود GY‏ من المقياسين. قيم ألفا تقريبًا مرتفعة مثل 
تلك التي تم الحصول عليها للمقاييس الكاملة عند إسقاط بند واحد (على سبيل JELI‏ 
البند H‏ من مقياس ١‏ والبند B‏ من مقياس (Y‏ ومع US‏ فإن الاحتفاظ بهذه البنود يوفر 
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التحليل العاملي 
بعض الضمان الإضافي Sb‏ الثبات لن ينخفض عن المستويات المقبولة في عينة جديدة ولا 
وك أطوال امقاريس بشكل كبن 


جدول (Y-I)‏ معامل ألفا لجميع البنود ولجميع ال 1 - k‏ مجموعات مركبة من البنود ا مجموعتين 
مختلفتين من البنود 





معامل Lali‏ كرونباخ للبنود غير المعيارية: 0.796472؛ وللبنود المعيارية: 0.802006 





























البنود المعيارية البنود غير المعيارية 
ألفا الارتباط بالمجموع ألفا الارتباط بالمجموع البند المحذوف 

ITEM I 675583 .741489 676138 .749666 
ITEM K 646645 .748916 644648 755695 
ITEM E 545751 .770329 535924 .775939 
ITEM D 562833 763252 572530 769222 
ITEM G 466433 .782509 474390 .787007 
ITEM H 409650 .793925 404512 799245 
ITEM A 437088 .785718 440404 .793003 











معامل Lili‏ كرونباخ للبنود غير المعيارية:0.811162؛ وللبنود المعيارية: 0.811781 



































البنود المعيارية البنود غير المعيارية 
ألفا الارتباط بالمجموع ألفا الارتباط بالمجموع البند المحذوف 
ITEM F .684085 748385 682663 .749534‏ 
ITEM C 596210 .775578 594180 .776819‏ 
ITEM J .636829 .762590 639360 .763036‏ 
ITEM L 593667 .776669 592234 .777405‏ 
ITEM B 491460 806544 493448 806449‏ 
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الفصل السادس 


جميع المحاذير ا مطبقة على المقاييس بشكل عام في هذه المرحلة من تطويرها قابلة 
للتطبيق على المقاييسس المشفقة بأساليب التحليل: العاملي: على سيل «JUL‏ من المهم جد 
تكرار GLI‏ المقاييس باستخدام عينة مستقلة. في الواقع» قد يكون من المفيد تكرار العملية 
التحليلية للعوامل بالكامل على عينة مستقلة لإثبات أن النتائج التي تم الحصول عليها م 
تكن حدثت مرة واحدة مصادفة. 


حجم العينة: 

إن احتمالية تكرار هيكلية العوامل هي Gje‏ على الأقل دالة في حجم العينة ا مستخدمة 
في التحليل الأصلي. بشكل ale‏ سيكون hè‏ العوامل الذي ينبثق من التحليل العاملي للعينة 
الكبيرة أكثر GLS‏ من ذلك الناتج من عينة أصغر. حتمًاء يطرح السؤالء ”ما هو الحجم الكبير 
الكافي؟* هذا سؤال من Gall‏ الإجابة عليه (على MacCallum, Widaman, JELI Jew‏ 
.(Zhang, & Hong, 1999‏ كما هو الحال مع العديد من الإجراءات الإحصائية الأخرى» 
ينبغي النظر إلى كل من نسبة subjects polis‏ العينة لعدد المتغيرات التي يتم تحليلها 
والعدد المطلق لعناصر العينةء لكن ثمة عوامل أخرى مثل تشبعات البنود تلعب أيضًا دوراً 
مهما في ذلك )1999 «(MacCallum et al.,‏ كلما olj‏ عدد البنود التي يجب أخذها في 
الحسبان وكلما زاد عدد العوامل المتوقعة» ينبغي إدراج المزيد من العناصر في التحليل. 
من المغريء elo‏ على هذه الحقيقة» البحث عن معدل قياسي لعدد العناصر إلى عدد 
البنود. ومع US‏ كلما olj‏ حجم العينة تدريجياً يمكن أن يتناقص معدل pobal‏ إلى 
البنود. بالنسبة لتحليل عاملي ل day ٠١‏ من المحتمل أن تكون pais ٠٠١‏ قليلة dae‏ 
ولكن بالنسبة لتحليل عاملي ل day ٠١‏ قد يكون pais 20١‏ مناسبًا. يقترح كل من 
Tinsley and Tinsley (1987)‏ معدلاً من حوالي 0 إلى polis ٠١‏ لكل بند Leg‏ يصل إلى 
حولي ٠٠١‏ عنصر. ويقترحان أنه عندما تكون العينة بحجم ۳۰۰ عنصرء فإنه هكن عدم 
التقيد بالنسبة بشكل صارم. في نفس الورقة, استشهدا مجموعة أخرى من ILE‏ 
منسوبة إلى )1973( Comrey‏ والتي تصنف عينة من pais ٠٠١‏ على أنها ضعيفةء و٠٠٠‏ 
pate‏ على pais ٠٠٠و dh ugio il‏ على أنها جيدة. و0١٠2‏ على أنها جيدة de‏ و١٠٠٠‏ 
على أنها ممتازة. ذكر كومري (VAM)‏ أن حجم العينة المكون من pais ٠٠١‏ مناسب في 
معظم حالات التحليل العاملي الاعتيادي التي لا تتضمن أكثر من ٠٠‏ بنداً. على الرغم من 
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التحليل العاملي 


أن علاقة حجم العينة بصلاحية الحلول التحليلية للعوامل أكثر تعقيدًا مما تشير إليه تلك 
القواعد القائمة على الخبرةء إلا أنه من الممكن أن تخدم الباحثين جيدًا في معظم الظروف. 
بالتأكيد ليس من غير المألوف رؤية التحليلات العاملية المستخدمة في تطوير المقياس 
استنادًا إلى أحجام عينات أكثر تواضعًا de)‏ سبيل ال مثال» ١6١‏ عنصراً). ومع BUS‏ فإن 
النقطة الجيدة هي أن العينات الأكبر تزيد من تعميم الاستنتاجات التي تم التوصل إليها 
عن طريق التحليل العاملي. IL‏ قد يكون تكرار حل التحليل العاملي على عينة منفصلة 
أفضل وسيلة لإثبات قابليتها للتعميم. 
الخلاصة: 
يعتبر التحليل العاملي أداة أساسية في تطوير المقايبس. حيث يسمح لمحلل البيانات 
بتحديد عدد العوامل التي تقوم عليها مجموعة من البنود مما يمكن تنفيذ الإجراءات مثل 
حساب WI‏ كرونباخ بشكل صحيح. بالإضافة إلى CUS‏ يمكن أن توفر لنا رؤية ثاقبة لطبيعة 
المتغيرات الكامنة التي تقوم عليها مجموعة البنود. 


تمارين: 

-١‏ اشرح مفهوم الهيكل البسيط ومدى ارتباطه باختيار العناصر لإدراجها في المقياس. 

-Y‏ التحليل ال موازي هو طريقة قاثمة على الإحصاء لتحديد عدد العوامل أو المكونات 
الرئيسية التي يجب الاحتفاظ بها. صف بإيجاز كيف تحدد هذه الطريقة العوامل أو 
المكونات التي يجب الاحتفاظ بها. 

-Y‏ افترض أن مجموعة من المتغيرات يتم تحليلها Wage‏ عن طريق استخراج العوامل 
المشتركة. وأن النتائج تكشف عن عامل Jof‏ أساسي وعدة عوامل أصغر. علاوة على 
WS‏ يتم تشبع كل بند من البنود على كل من العامل الأول وواحد من العوامل الأصغر. 
يرغب الباحث § إنشاء مجموعة من المقاييس من هذه البنود. لكنه يشعر بالانزعاج 
من نمط التشبعات التي يكشف عنها هذا التحليل الأولي. ما الطريقة التحليلية للعوامل 
البديلة التي يمكن استخدامها لتحديد ما إذا كان يمكن تفسير البنود على أنها تنتمي إلى 
مجموعة من ال مجموعات أحادية البعد نسبياً؟ 


تطوير المقاييس: النظرية والتطبيق ۷۲ 


الفصل السادس 
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الفصل السابع 
نظرة dole‏ على نظرية الاستجابة للبند (IRT)‏ 


نظرية الاستجابة للبند (RT)‏ هي بديل لنظرية القياس الكلاسيكية. وتسمى Las}‏ 
نظرية الاختبار الكلاسيكية Classical Test Theory (CTT)‏ وقد لاقت هذه النظرية 
اهتمامًا متزايدًا في السنوات الأخيرة» وغالبًا ما يتم تقدهها كبديل حديث ومتفوق على 
النظرية الكلاسيكية CTT‏ (على سبيل امثال. De Boeck & Wilson, 2004: Embretson‏ 
Reise, 2010: Nering & Ostini, 2010; Reise & Revicki, 5‏ &). كلتا النظريتان 
تشتركان في عدة خصائص أساسية. على سبيل SEM‏ أحادية البعد للمقياس تعد Ú à‏ 
لكل من نظريتي ag) .IRT9 CTT‏ يجب أن تشترك البنود في متغير واحد فقط IŠ]‏ 
أريد دمجها في مقياس. بمعنى آخرء تحت هذين الممنهجين» يجب أن تتقاسم البنود u‏ 
مشتركًا Mol‏ وبالتالي ترتبط ببعضها البعض. إذا كانت مجموعة من البنود متعددة الأبعاد 
LS)‏ قد يكشف التحليل العاملي)» فإنه يجب التعامل مع مجموعات البنود أحادية البعد 
ا منفصلة بشكل فردي. وهذا الأمر ينطبق في كل من النهج الكلاسيكي CCT‏ ونهج نظرية 
الاستجابة للبند. UU‏ على سبيل JELI‏ إذا شكلت مجموعة مكونة من 20 بنداً خمسة 
عوامل منفصلة» فسيتم التعامل مع كل مجموعة من مجموعات البنود الخمسة بشكل 
منفصل» مما قد ينتج dic‏ خمسة مقاييس. 

يُفرّق كلا الأسلوبين في القياس أيضًا بين تباين البند الذي Liss‏ عن المستويات الفعلية 
للمتغير الكامن والتباين الذي ينشاً من الخطأء لكن الطريقة التي يتم بها التمييز بين 
الدرجة الحقيقية true score‏ والخطأ تختلف بين أسلوبي القياس. الفكرة الأساسية 
الكامنة وراء نظرية القياس الكلاسيكية هي أن الدرجة المرصودة هي ببساطة نتيجة 
للدرجة الحقيقية بالإضافة إلى الخطأً. مصدر هذا الخطأ لا تتم تجزئته إلى مصادر فرعية, 
مثل الاختلاف في الوقت أو البيئة أو البنود. بدلاً من US‏ يتم جمع كل jalas‏ الخطأ 
3 حد خطأ واحد. 
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الفصل السابع 


بينما تميز طرق نظرية الاستجابة للبند الخطأ بشكل أكثر دقة. خاصة فيما يتعلق 
بخصائص البنود التي قد تؤثر على أدائها. 

الهدف من نظرية الاستجابة للبند هو تمكين الباحث من تحديد خصائص معينة للبنود 
التي تكون مستقلة عمن يجيب عليها. وهذا مماثل للقياس المادي الذي يمكن فيه تقييم 
dow‏ كائن ما (مثل الطول أو الوزن) دون النظر إلى الطبيعة المحددة للكائن. عشرون Alby‏ 
على سبيل Jb!‏ تعني نفس الشيء بغض النظر عما يتم وزنه. Shs‏ يعطي مقياس 
الوزن التقليدي معلومات حول خاصية محددة للأشياء (أي الوزن) بغض النظر عن طبيعة 
الكائن الذي يتم وزنه. تطمح طريقة نظرية الاستجابة للبند أن تعمل الشيء نفسه مع بنود 
الاستبيان. الطرق الكلاسيكية تربط بعلاقة متأصلة بين أداة القياس والأشخاص الذين يتم 
قياسهم بينما لا تفعل طريقة نظرية الاستجابة للبند ذلك على الأقل من الناحية النظرية. 
على سبيل SU!‏ يتأثر ثبات المقياس dg‏ لنظرية القياس الكلاسيكية بالارتباطات بين البنود 
المكونة لهذا المقياس. فإذا كان الأفراد الذين تشكل بياناتهم أساسًا لتقييم الثبات متماثلين 
للغاية في مستويات السمة الخاصة بهم» OL‏ مدى درجاتهم الحقيقية سيكون Apdo‏ من 
نتائج قصر المدى أن تكون الارتباطات بين البنود أصغرء وبالتالي سيكون ثبات المقياس أقل 
بالنسبة للعينة التي يختلف فيها الأشخاص على نطاق أوسع فيما يتعلق بالسمة المقاسة. 
وبالتاليء فإن الثبات الذي يحصل عليه الفرد وفقًا لنظرية القياس الكلاسيكية لا تتعلق 
فقط بأداء أداة القياس» ولكن في بعض الظروفء تتعلق أيضًا بخصائص العينة قيد الدراسة. 
أساليب Y IRT‏ تبني تقييمات الثبات على أساس بيانات العينة بالطريقة نفسها التي تتبعها 
أساليب القياس الكلاسيكية. edb‏ في نهاية المطافء لكلا الأسلوبينء يتم جمع معلومات 
البنود من الأفراد. JWhy‏ فإن تحقيق اللميزة النظرية التي يمتلكها أسلوب نظرية الاستجابة 
للبند على أساليب القياس الكلاسيكية يعتمد على مدى تقييم البنود الموجودة تحت أسلوب 
نظرية الاستجابة للبند عبر عينات كبيرة غير متجانسة. 

وصف جميع الاختلافات بين الأسلوب الكلاسيي وأسلوب نظرية الاستجابة للبند خارج 
نطاق هذا الفصل. وللحصول على نظرة عامة عن أسلوب نظرية الاستجابة للبندء هكن 
الاطلاع على )1991( Yur Hambleton, Swaminathan, & Rogers‏ من محاولة إجراء 
مقارنة شاملة. في الأقسام AJI‏ سأركز على ثلاثة أوجه تمييز رئيسية بين أساليب القياس 
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نظرة dole‏ على نظرية الاستجابة للبند (IRT)‏ 


القائمة على نظرية القياس الكلاسيكية ونظرية الاستجابة للبند: )١(‏ التركيز على البنود 
مقابل المقياس (Y) JSS‏ تحديد البنود GIS‏ المستويات المحددة للسمة التي يتم قياسهاء 
و(”) التمثيل ا مرئي لخصائص البند والمقياس. 

أول فرق مهم بين الأسلوبين هو أن نظرية الاستجابة للبند تولي اهتمامًا DS‏ لخصائص 
البنود التي تشكل المقياس. في المقابل» تميل النظرية الكلاسيكية إلى التأكيد على خصائص 
المقياس ككل. كمثال على هذا الاختلافء. فكر في الثبات. عندما ناقشنا معامل ألفا 
كرونباخ في سياق القياس الكلاسيكي, لاحظنا أنه يمكن تعزيز WI‏ إما عن طريق زيادة عدد 
البنود أو عن طريق تحسين متوسط الارتباط بين البنود. وبالتاليء فإن المزيد من البنود 
أو البنود الأفضل Ling)‏ أن تكون مرتبطة بقوة أكبر مع المتغير الكامن) سوف يحسن 
الثنات. في نظرية القياس be WE ASSIS‏ يزداد OLS‏ المقياس من خلال التكرار - 
إضافة المزيد من البنود. Sole‏ يتم تعزيز OLY!‏ في طرق IRT‏ ليس بالتكرار ولكن (حيثما 
أمكن ذلك) من خلال تحديد بنود أفضل. وهذا يعني أن نهج IRT‏ ينظر إلى الثبات 
بشكل أساسي من منظور البنود, في Qe‏ تنظر الأساليب الكلاسيكية إلى الثبات من منظور 
المقياس ككل. بينما يمكن للطرق الكلاسيكية. Jio‏ فحص الارتباطات بين البنود وا مجموع 
الكلي item-total correlation‏ تحديد كيفية مساهمة كل بند على حدة في الثبات ANII‏ 
للمقياس» إلا أن هذه العملية أقل ترسحًا في الأساليب الكلاسيكية منها في أساليب نظرية 
الاستجابة للبند لتطوير المقياس والتقييم. 


يتمثل الاختلاف الثاني بين طريقتي القياس في أن نظرية الاستجابة للبند تفحص بشكل 
صريح مستوى oudl‏ المقاسة الذي يؤثر بقوة على بند ما. قد يتم “laud”‏ بنود مختلفة 
مستويات مختلفة من dail‏ وبالتالي» قد تكون حساسة للاختلافات على أجزاء مختلفة 
هن السلسيئلة dLaxhl‏ الكاملة le dou! AU‏ سمل المثالة Ley‏ شس د مكل pel”‏ 
أحيانًا بالحزن“ مستوى أقل من الحزن أو الاكتئاب مقارنة ببند مثل ”أشعر أن الحياة 
لا تستحق العيش“. قد هيز البند الأول شخصًا نادرًا ما يشعر بمشاعر الحزن أو الاكتئاب 
عن الآخرين الذين يعانون من هذه المشاعر بشكل متكرر. ورها لا يكون مفيداً في التمييز 
بين الأشخاص الذين يشعرون بالحزن أحياناً عن أولئك الذين يشعرون بالحزن في الغالب. 
من ناحية أخرىء قد هيز البند الثاني فقط بين الأشخاص في الطرف العلوي من السلسلة 


تطوير المقاييس: النظرية والتطبيق YVo‏ 


الفصل السابع 


المتصلة للحزن أو الاكتئاب. وقد يفشل جميع الأشخاص على امتداد جزء كبير من هذه 
السلسلة في إقرار هذا البندء بينما الذين يعانون بشكل كبير من الحزن أو الاكتئاب يجيبون 
بشكل إيجابي. تحدد أساليب نظرية الاستجابة للبند هذين البندين على أنهما يمثلان Bw‏ 
مختلفة في سلسلة متصلة من الاكتئاب. من خلال تحديد البنود GIS‏ الصلة بالنقاط على 
السلسلة المتصلة للمتغير الذي يتم قياسه» هكن لطرائق نظرية الاستجابة للبند أن تساعد 
مطور الاختبار على تمثيل النطاق الكامل للسلسلة المتصلة للسمة التي يتم قياسها (الاكتئاب 
في هذا المثال) بالبنود المناسبة. بمعنى أنه يمكن تضمين البنود في مقياس يمثل مستويات 
منخفضة ومعتدلة وعالية من السمة بسهولة أكبر تحت نظرية الاستجابة للبند OY‏ هذه 
الطرق تربط البنود بشكل صريح بمستويات السمة التي تتعلق بها. في حين أن هناك طرق 
قياس كلاسيكية يمكن أن تحقق نتائج مماثلة (مثل فحص نسب الممجيبين الذين يؤيدون كل 
بند وإجمالي الدرجات التي تصف المؤيدين وغير المؤيدين). فإن هذه الطرق ليست خطوة 
dole‏ في طرق القياس الكلاسيكية. في المقابلء يعد تقييم «صعوبة» البند جزءًا لا يتجزاً 
من معظم طرق نظرية الاستجابة للبند. مدى قوة ارتباط بند ما بالمتغير الكامن وموقع 
البند على طول السلسلة المتصلة للسمة» يكون لهما تأثير على الثبات. البنود المرتبطة بقوة 
با متغير الكامن سترتبط أيضاً ارتباطًا Go‏ مع بعضها البعض, وبالتالي زيادة متوسط الارتباط 
الداخلي بين البنود inter-item correlation‏ وزيادة OLS‏ المقياس. علاوة على US‏ من 
خلال تطوير بنود جيدة على طول النطاق الكامل للمتغير» يمكن للمرء أن يؤكد أن المقياس 
الناتج يمكن الاعتماد عليه عبر نطاق واسع من السمة التي يتم قياسها وليس فقط في أجزاء 
معينة منها. Why‏ هكن أن يعزز كل من هذه الجوانب الشائعة والموجهة نحو البند في 
نظرية استجابة البند ثبات المقياس. 

الاختلاف الثالث لنظرية الاستجابة للبند بالنسبة لطرق القياس الكلاسيكية يرتبط 
ارتباطًا وثيقًا بالأولين. تستخدم طرق نظرية الاستجابة للبند على نطاق واسع الأشكال 
الرسومية كوسيلة لتمثيل خصائص البنود والمقاييس ككل. سننظر إلى بعض هذه الصور 
قريبًاء لكن Voi‏ سأناقش أصول بعض ال مصطلحات ال مستخدمة dole‏ مناقشة خصائص 
البنود تحت نظرية IRT‏ وترتبط ارتباطًا وثيقًا بالأشكال الرسومية التي تستخدمها نظرية 
الاستجابة للبند. 


۷1 تطوير المقاييس: النظرية والتطبيق 


نظرة dole‏ على نظرية الاستجابة للبند (IRT)‏ 


نظرًا لأن أسلوب نظرية الاستجابة للبند LG‏ في سياق اختبار القدرات» OB‏ مفرداته 
vocabulary‏ تحتوي على مصطلحات مرتبطة bole‏ منطقة ا محتوى تلك. las Las}‏ 
لتصنيف البنود في اختبارات القدرة على أنها ”صحيحة“ أو ”غير صحيحة“ (على الرغم من 
أن تنسيقها الأصلي قد يشتمل على أكثر من خيارين للاستجابة)» فإن التطبيقات التقليدية 
والأمثلة على نظرية الاستجابة للبند تتضمن بنوداً تأخذ واحدة من حالتين (على سبيل 
المثال» «الاجتياز» مقابل «الفشل»). من الأمهل مناقشة نظرية الاستجابة للبند Baye‏ 
ogi‏ من هذا cE gill‏ على الرغم من أنه لا يوجد سبب هنع من توسيع الطرق المنبثقة 
عن النظرية (كما كانت بالفعل) لتشمل بنوداً ذات صيغ استجابة أخرى (مثل مقاييس 
(Likert‏ تتطرق لمجالات ا محتوى الأخرى. سننظر في البنود من هذا النوع الأخير في وقت 
لاحق من الفصل. 

نظرية الاستجابة للبند هي في الحقيقة مجموعة من النماذج بدلاً من نظرية تحدد 
مجموعة واحدة من الإجراءات. إحدى الطرق اللهمة التي تختلف بها النماذج البديلة 
لنظرية الاستجابة للبند هي عدد معلمات البنود التي هي محل الاهتمام. كان النهج 
ا مشترك في السنوات الأخيرة هو نموذج الثلاث معلمات three-parameter model‏ 
والذيء بشكل غير مفاجئ» يركز على ثلاثة جوانب من lol‏ البند. وهي صعوبة البند 
item difficulty‏ وقدرته على التمييز item discrimination‏ والتخمين guessing‏ - أو 
بشكل esl‏ قابليته للإيجابيات الخاطئة .susceptibility to false positives‏ أحد عناصر 
عائلة IRT‏ في وقت مبكرء وما زال يتمتع بشعبية» هو نمذجة راش Rasch modeling‏ 
(على (Rasch, 1960; Wright, 1999 JELI Jew‏ والتي تحدد فقط معامل الصعوبة. 


:Item Difficulty صعوبة المند‎ 


على الرغم من أن مصطلح ”صعوبة البند“ أ - كما يتضح - من اختبار القدرة إلا 
أن المفاهيم التي يمثلها قابلة للتطبيق على نطاق أوسع. تشير صعوبة البند إلى مستوى 
السمة المقاسة المرتبطة بالانتقال من ”الفشل“ إلى ”اجتياز“ هذا البند. لقد شاهد معظمنا 
الأفلام القديمة التي تصور الكرنفالات أو المتنزهات التي تتميز ببعض العمل البطولي. ”جهاز 
القياس“ هو مسار gagas‏ ينتقل one‏ الثقل. في الجزء العلوي من المسار يكون هناك جرس. 


تطوير المقاييس: النظرية والتطبيق VV‏ 


الفصل السابع 


في البداية» يقع الثقل في أسفل المسار عند نهاية لوح خشبي هثل قاعدة الجهاز. يضرب 
”المشاركون" هذه القاعدة التي تقع مقابل الثقل باستخدام مطرقة كبيرةء Jbg‏ يتحرك 
الثقل إلى أعلى على طول المسار. هدفهم هو دفع الثقل بقوة كافية لضرب الجرس. لأغراضناء 
يمكننا أن نفكر في الجهاز بأكمله باعتباره ”البند“ (انظر الشكل رقم (V-V‏ 











شكل (1-1): جهاز افتراضي لاختبار القوة التي يؤدي فيها ضرب القاعدة بالمطرقة بقوة كافية إلى رنين الجرس 


تتمثل صعوبة البند في مقدار القوة التي يجب أن Slag‏ «اللمستجيب» gf)‏ على نحو 
dal‏ القوة التي يجب أن يبذلها المستجيب) من أجل «اجتياز» البند (على سبيل JEL‏ دق 
الجرس). بوضوح» يمكن للمرء بناء بنود مختلفة بدرجات مختلفة من الصعوبة As)‏ سبيل 
JEI‏ «أشياء» أكثر صعوبة بمسارات أطول أو أثقال أكثر وزناً). ومع US‏ يجب أن يكون 
من الممكن معايرة صعوبة جهاز معين يكون مستقلاً عن أي خاصية للشخص الذي يضرب 
بالمطرقة في تلك اللحظة. 


YVA‏ تطوير المقاييس: النظرية والتطبيق 


نظرة dole‏ على نظرية الاستجابة للبند (IRT)‏ 


نظرًا OY‏ هذا «الشيء» هو كائن ماديء فسيكون من السهل إلى حد ما تحديد مقدار 
القوة اللازمة للتسبب في رنين الجرس (مع التجاهلء في الوقت الحالي» تأثير ضرب القاعدة 
في مواقع مختلفة قليلاً عن نقطة الارتكاز). لذ يُفترض أن يطلب مشغل الكرنفال جهارً 
بحجم ٠١‏ أرطال أو جهارًا يبلغ وزنه ٠٠١‏ رطل لتحقيق Jazo»‏ اجتياز» مرتفع أو منخفض 
حسب الأشخاص الذين يلعبون اللعبة. كل من تلك الأوزان قد يكون مناسبًا بشكل خاص 
مجموعات مختلفة من العملاء (مثل الأطفال الذين يحضرون معرضًا للمدرسة مقابل 
البالغين الذين يحضرون معسكرًا رياضيًا). 

يمكن للمرء أن يصف بنود استبيان بطريقة مماثلة. بالنظرء على سبيل SU!‏ إلى بنود 
قياس الاكتئاب» كما فعلنا في وقت سابق. يمكن للمرء أن يصمم البند ليكون ”سهلا Guus‏ 
(على سبيل المثالء ”أشعر أحيانًا بالحزن“) أو ”صعبًا “Gud‏ (على سبيل المثال» ”أشعر أن 
الحياة لا تستحق العيش“). في الحالة الأولى» ستكون هناك حاجة فقط إلى قدر متواضع من 
السمة ”الاكتئاب“ ”لاجتياز“ (أي المصادقة) البند. لكن ألا يعتمد احتمال إصابة الشخص 
بهذا الشعور على من سئل؟ على سبيل JEBI‏ إذا طرحنا هذا السؤال على الأشخاص المصابين 
سريرياً بالاكتئاب» فربما نجد أن نسبة أكبر من تلك العينة تؤيد هذا البند أكثر مما لو قمنا 
بطرح هذا السؤال على الجمهور العام. الهدف من تحديد صعوبة البند هو تحديد مقدار 
السمة المطلوبة لاجتياز البند با معنى المطلق. إذا كان ذلك ممكتاء فإن اجتياز الشخص لهذا 
البند له معنى ثابت فيما يتعلق بمستوى الاكتئاب» بصرف النظر عمن يكون هذا الشخص 
أو متوسط مستوى الاكتئاب في العينة قيد الدراسة. GST Ging‏ يمكن وصف الشخص ليس 
فقط بالإشارة إلى عينة محددة ولكن من حيث المقياس المستقل عن أي عينة محددة. 


تمييز البند :Item Discrimination‏ 
المعلمة الثانية التي تتناولها نظرية الاستجابة للبند IRT‏ هي الدرجة التي تصنف بها 
الاستجابة S‏ ”اجتياز“ أو ”فشل“ على أحد البنود بشكل لا لبس فيه. على نحو مختلف» 
كلما قل الغموض حول ما إذا كان الشخص ”اجتاز“ حقًا أو ”فشل“ olj‏ التمييز في البند 
المعني. باستخدام تشبيه الجرس الكرنفالي الذي تمت الإشارة إليه سابقاً قد تكون هناك 
مناسبات عندما يكون الثقل BIL‏ يتصل بالجرسء مما يتسبب في اختلاف Sl bl‏ حول 


تطوير المقاييس: النظرية والتطبيق yva‏ 


الفصل السابع 


ما إذا كان الجرس قد رن بالفعل آم لا. قد يسمع البعض Ley‏ خافتًاء بينما Y‏ يسمع 
الآخرون Ed‏ على الإطلاق. ضمن نطاق القوة التي تدفع الثقل بحيث يلامس الجرس 
Lys‏ نتج ما يتفق عليه الجميع على أنه صوت رنين واضح» فإن الجهاز في هذه 
الحالة يعطي معلومات غامضة. وبالنظر إلى هذا الغموض بطريقة أخرىء فإن نفس القوة 
المطبقة عدة مرات قد تؤدي إلى قيام المراقبين بتحديد أن الجرس قد رن في بعض المناسبات 
ولكنه م يرن في مناسبات أخرى. وبالتالي فإن قوة أكبر إلى حد ما سوف تنتج باستمرار رنيناً 
واضحاً Y‏ لبس فيه» في حين أن قوة أضعف إلى حد ما سوف تنتج فشل (عدم رنين) لا لبس 
فيه على الدوام. ولكن هناك نطاق صغير من القوة التي يكون فيها الجهاز غامضًا. قد 
يعمل جهاز بديل بشكل مختلف وتنتج dis‏ نتائج أقل غموضًا. على سبيل SEL!‏ قد تؤدي 
ملامسة الثقل للجرس إلى فصل التيار عن الدائرة الكهربائية ومن ثم تحريك قواطع التيار 
الكهربائي مما يتسبب في إضاءة المصباح ويظل Flai‏ حتى تتم dole]‏ ضبطه. إذا تم تصميم 
هذا الجهاز بشكل جيد» فمن المحتمل أن يسفر عن نتائج متسقة على نطاق صغير إلى حد 
ما من القوىء وبالتالي» سوف jug‏ بشكل أفضل من الجهاز القياسي. بدلاً من ذلك فإن 
الجهاز الذي لم يكن له جرس على الإطلاق ولكنه بدلاً من ذلك طالب المراقبين برفع أيديهم 
إذا تجاوز الثقل Las‏ محدد مسبقًا بجوار المسار الخاص cds‏ من المحتمل أن ينتج dis‏ مزيد 
من الغموضء ومن ثم» فإن التمييز أقل. O UL‏ الجهاز أو البند الذي هيز Le‏ يحتوي 
على جزء ضيق من نطاق ظاهرة الاهتمام التي تكون فيها النتائج غامضة. يحتوي الجهاز 
أو البند الأقل hug‏ على مساحة أكبر من الغموض. 


التخمين» أو الإيجابيات الزائفة :Guessing, or False Positives‏ 
المعلمة الثالثة في نظرية الاستجابة للبند هي التخمينء أو الإيجابيات الزائفة. يعد 
مصطلح ”التخمين“ مرة أخرىء By)‏ من أصول نظرية الاستجابة للبند في اختبار القدرة. في 
اختبار الاختيار من متعدد» يمكن للمستجيب الذي م يكن يعرف الإجابة الصحيحة Usd‏ 
اجتياز البند عن طريق تخمين خيار الجواب الصحيح. هذا التخمين هو إيجابي زائف. أي 
أنه يعطي إشارة إيجابية إلى أن المستجيب tg‏ مستوى معيئًا من القدرة على الرغم 
من أنه لا يعرف بالفعل الإجابة الصحيحة على البند المعني. وبالتايء فإن اعتبار ا معلمة 


1۸۰ تطوير المقاييس: النظرية والتطبيق 


نظرة dole‏ على نظرية الاستجابة للبند (IRT)‏ 


كإيجابية زائفة Vay‏ من التخمين يسمح W‏ بالتعميم بسهولة أكبر خارج سياق اختبار 
القدرة. لعل تشبيه كرنفال آخر قد يوضح فكرة Glow]‏ زائف. رها تكون قد رأيت أكشاك 
يجلس فيها شخص خلف حاجز واقي من نوع ما فوق خزان مياه على منصة متصلة بذراع 
تمتد إلى جانب مرسوم عليه الهدف (انظر الشكل رقم AV-V‏ 





شكل (۲-۷): جهاز افتراضي لقياس دقة الرمي يؤدي فيه ضرب الهدف بالكرة إلى انهيار المنصة 
وسقوط الشخص الذي يجلس عليها في خزان الماء 

يُطلب من المتسابقين إلقاء كرات البيسبول على الهدف. مما يؤدي في حالة تعرضه 

لاصطدام الكرات إلى انهيار المنصة وسقوط الشخص في خزان المياه الذي يقع تحته. هكننا 

التفكير في هذا الجهاز باعتباره «بندا» يقيس Bo‏ الرمي. يؤدي التسبب في سقوط الشخص 

من على المنصة في خزان المياه إلى «اجتياز» هذا البند. OV!)‏ يجب أن تكون قادرًا على 

وصف كيف يمكن أن تؤدي الاختلافات في الجهاز إلى زيادة أو تقليل صعوبة الجهاز 


تطوير المقاييس: النظرية والتطبيق YAN‏ 


الفصل السابع 


وتمييزه). مع هذا الجهاز المحدد., يمكن للمرء أن يتخيل كيف هكن أن تحدث «إيجابيات 
زائفة» - أي كيف هكن للمشارك بدون أي قدرة تقريبًا أن يسجل «اجتياز» عن طريق 
التسبب في سقوط الشخص الذي يجلس فوق الخزان. قد تكون إحدى الطرق هي أن 
«المشارك» يرمي بعنف ولكن الكرة تصيب الهدف فقط (يجب أن تذهب إلى مكان ماء بعد 
كل شيء). أو Vu‏ من US‏ قد يتعطل الجهاز وقد تنهار iall‏ تلقائيًا. في هده eM‏ 
يقوم اللاعب / المشارك «بالاجتياز» ليس بناءً على القدرة ولكن sly‏ على بعض الظروف غير 
ذات الصلة. Why‏ من الممكن «اجتياز» اختبار الرمي هذا حتى لو كانت قدرة الشخص 
قليلة أو معدومة. كما SS‏ سابقًاء في سياق اختبار القدرات» تحدث الإيجابيات الزائفة 
بشكل dows SLs‏ التخمين الناجح للإجابة الصحيحة على سؤال ما على الرغم من عدم 
معرفة الإجابة حقًا. (في سياقات القياس التي تكون فيها فرص التخمين أو الأنواع الأخرى 
من الإيجابيات الزائفة ضئيلة Ale‏ مثل استخدام المقاييس لقياس الوزن le DE‏ يكون 
نموذج المعلمتين - أي الصعوبة والتمييز - (LS‏ 

كل من معلمات البند الثلاثة هذه - الصعوبة والتمييز والإيجابيات الزائفة - لها علاقة 
واضحة إلى حد ما بخطأ القياس. إذا كانت (I)‏ صعوبة بند ما غير مناسبة: أو (ب) تكون 
مساحة الغموض بين الاجتياز والفشل كبيرة» أو (ج) يشير البند إلى وجود dow‏ ما حتى في 
حالة غيابهاء فإن البند يكون معرضاً للخطأ. تحدد نظرية الاستجابة للبند هذه الجوانب 
الثلاثة لأداء بند cle‏ وبالتالي توفر وسيلة لاختيار البنود التي من المحتمل أن تعمل بشكل 
جيد في سياق معين. OW‏ لنرى كيف ترتبط هذه المعلمات الثلاث با ميزة الثالثة اممهمة التي 
تميز أساليب نظرية الاستجابة للبند عن الأساليب الكلاسيكية» وذلك من خلال استخدام 
الرسوم البيانية لتوضيح خصائص البند. 


:ITEM-CHARACTERISTIC CURVES (ICC) المنحنيات المميزة للبنود‎ 


يمكن تلخيص صعوبة البند وتمييزه وتوليد إيجابيات زائفة في شكل المنحنى المميز للبند 
(ICC)‏ الذي بمثل أداء البند بيانياً عادة يكون منحنى ICC‏ على شكل حرف D S‏ 
وتک : bs‏ فة :مق ااا عن معلومات حول كل من المعلمات الثلاثة محل الاهتمام. 


YAY‏ تطوير المقاييس: النظرية والتطبيق 


نظرة dole‏ على نظرية الاستجابة للبند (IRT)‏ 


يوضح الشكل رقم (۳-۷) ما قد يبدو عليه شكل المنحنى المميز للبند Cue ICC‏ هثل 
المحور الأفقي × قوة الخاصية المميزة أو السمة التي يتم قياسها (مثل المعرفة أو القوة 
أو الدقة أو الاكتئاب أو الرغبة الاجتماعية أو أي ظاهرة أخرى قابلة للقياس). بينما يمثل 
المحور الرأسي لا احتمال ”اجتياز“ البند ا معني Fla‏ على نسب درجات الفشل والاجتياز 
التي يتم ملاحظتها. إن معرفة كيفية استخدام المنحنى ال مميز للبند ICC‏ لتقييم جودة 
البند يكون أسهل في الواقع إذا نظرنا إلى مخطط بياني هشل بندين Lug‏ مقارنتهما. 


منحنى" 0 البند افتراضي ثنائي (اجتياز/فشل) 

















CAS Tete Sale انال‎ aE) a اا‎ 


يوضح الشكل رقم )٤-۷(‏ صعوبة البند من خلال عرض منحنيين. لاحظ أن النقاط التي 
يحقق فيها ال منحنيان احتمالًا بنسبة +20 في اجتياز بنودهما مختلفة. بالنسبة للمنحنى 
رمادي all‏ تكون هذه النقطة أبعد إلى اليمين. معنى» يجب أن يكون مقدار السمة 
أعلى للفرد حتى يكون لديه فرصة بنسبة +20 لاجتياز البند الذي هثله المنحنى الرمادي 
مقارنة بالبند الذي alte‏ المنحنى أسود اللون. باستخدام هذا المعيارء يكون البند الذي 
alig‏ المنحنى الرمادي أكثر صعوبة. الصعوبة في هذه الحالة ليست حكمًا GIS‏ وإنما وصفًا 


تطوير المقاييس: النظرية والتطبيق YAY‏ 


الفصل السابع 


واقعيًا dha‏ على المحور الأفقي × ALLL!‏ لتقاطع المنحنى لقيمة الاحتمال ٠,0٠‏ على 
المحور الرأمي Y‏ 

















شكل :(£-V)‏ منحنيا ICC‏ افتراضيان لبندين ثنائيين (اجتياز/فشل) مختلفين فى درجة تحديد الصعوبة difficulty‏ 


يوضح JS‏ رقم (0-V)‏ كيف نقوم بتقييم التمييز discrimination‏ باستخدام نفس 
المنحنيان المميزان للبند TCCs‏ يحتوي البند المقابل للمنحنى أسود اللون على slope Já‏ 
أكثر انحدارًا عند نقطة الاجتياز “0٠‏ من البند الذي يمثله المنحنى رمادي اللون. والنتيجة 
هي أن زيادة أقل في السمة تعطي زيادة أكبر في الثقة Gb‏ المستجيب سيجتاز هذا البند 
مما هو عليه بالنسبة للبند الذي يمثله ال منحنى الرمادي اللون. LU‏ يكشف المنحنى أسود 
اللون أن منطقة المحور الأفقي × التي تتوافق مع درجة غامضة أصغر من المنطقة المكافئة 
للبند الآخر. وبالتالي» فإن بند المنحنى أسود OWI‏ هيز بين أولئك الذين يفشلون والذين 
يجتازون بشكل أكثر فعالية من بند ا منحنى رمادي اللون. 


YAE‏ تطوير المقاييس: النظرية والتطبيق 


نظرة dole‏ على نظرية الاستجابة للبند (IRT)‏ 

















شكل :(0-V)‏ منحنيا ICC‏ افتراضيان لبندين ثنائيين (اجتياز/فشل) مختلفين في تحديد درجة التمييز 
discrimination‏ 


si‏ في الشكل رقم (1-V)‏ يمكننا أن ننظر إلى ميول البندين elas‏ درجات الاجتياز 
حتى عندما تكون قدرة (أو أياً كانت السمة التي يتم قياسها) المستجيب في الأساس تساوي 
Í io‏ وكما كنت أنت قد خمنت» يتم تحديد ذلك من خلال النقطة التي يتقاطع فيها 
ا منحنى المميز للبند ICC‏ مع ا محور الرأسي Y‏ بالنسبة للبند ا ممثل بالمنحنى أسود اللونء 
تكون قيمة القاطع intercept‏ صفرا. وبالتالي. فإن احتمال قيام شخص ما باجتياز البند إذا 
كان يفتقر تمامًا إلى السمة اممعنية سيكون صغيراً Me‏ بالنسبة للبند ا ممثل بالمنحنى رمادي 
«oll‏ فإن هناك احتمالاً كبيراً (حوالي Ob (4Y‏ شخصًا لا يتمتع بالسمة أو القدرة المقاسة 
سيجتاز البندء وبالتالي» لا مكن تمييزه استنادًا إلى البند ا معني» من شخص ذي قدرة عالية. 
(لاحظ أن هذا سيكون هو الحال مع بند متعدد الخيارات له خمس إجابات محتملة 
إحداها كانت صحيحة). يوضح الرسم التخطيطي في الشكل رقم (I-V)‏ الاختلافات في 
قواطع intercepts‏ ا محور الرأسي Y‏ للبندين - التي تعد الأساس لاستنتاج ذلك. مرة أخرىي 
البند الممثل بالمنحنى أسود اللون هو الأفضل Flo‏ 


تطوير المقاييس: النظرية والتطبيق YAO‏ 


الفصل السابع 


الايجابيات الزائفة 








| لقوا | طع Intercepts‏ ,= 














شكل :(1-V)‏ منحنيا ICC‏ افتراضيان لبندين ثنائيين (اجتياز/فشل) مختلفين في درجة تحديد 
الإيجابيات الزائفة false positives‏ 


من الناحية dy ul‏ هكن استخدام نظرية الاستجابة للبند IRT‏ لتحديد اعمات 
لكل بند من البنود. بعد US‏ اعتمادا على تفاصيل التطبيق المراد. يمكن استخدام البنود 
ذات الأداء الأمثل معالجة مشكلة القياس الموجودة. على سبيل JEL‏ ممكن أخذ äus‏ 
من البنود ”السهلة“ لتطبيقها على الأشخاص الذين لديهم مستويات منخفضة نسبيًا من 
القدرة (السمة) duck!‏ وأخذ عينة من البنود الصعبة لأولئك الذين لديهم مستويات عالية 
من القدرة أو السمة المعنية. هذا يشبه بشكل مباشر استخدام جهاز جرس يزن ٠١‏ أرطال 
في معرض أو كرنفال مخصص للأطفال وجهاز جرس يزن ٠٠١‏ رطل في معسكر للرياضيين 
البالغين. يمكن أن يؤدي استخدام البند الخطأ - مثل استخدام جهاز الجرس الخاطئ - إما 
إلى الإحباط (إذا كانت المهمة صعبة للغاية) أو نقص الدافع (إذا كانت المهمة سهلة للغاية). 
أيضًاء إذا كان المقياس الذي سيتم توليفه سيكون أساسًا لقرارات age‏ فإن تقليل نطاق 
الغموض لكل بند واحتمال ظهور إيجابيات زائفة هي أيضًا احتمالات جذابة. 


YM‏ تطوير المقاييس: النظرية والتطبيق 


نظرة dole‏ على نظرية الاستجابة للبند (IRT)‏ 


استخدام الاختبار التكيفي adaptive testing‏ هو امتداد لهذه الفكرة. في الاختبار 
التكيفي» البنود المطبقة على كل فرد يمكن تصميمها وفقًا لمستوى السمة عند ذلك الفرد. 
إن اجتياز بند سابق أو الفشل في EU‏ يمكن أن يرشد إلى اختيار البند Jd}‏ مع إعطاء 
الأفضلية لبند تم ضبطه على مستوى القدرة الذي تشير إليه الإجابات السابقة. تتم إدارة 
هذه العملية dole‏ بواسطة جهاز كمبيوتر bo Wes‏ يشار إليها باسم الاختبار التكيفي 
امحوسب computerized adaptive testing‏ أو .CAT‏ على الرغم من أن هذه المنهجية 
تتطلب مجموعة كبيرة من البنود التي تمثل مجموعة واسعة من مستويات القدرة, إلا أنها 
أداة قوية تتيحها طرق نظرية الاستجابة للبند ART‏ 

تتمتع طرق نظرية الاستجابة IRT UU‏ بميزة واضحة تتمثل في توجيه انتباهنا إلى ثلاثة 
جوانب (نسخة المعلمات الثلاثة الشائعة (be‏ لأداء بند ما. من خلال الأساليب المتجذرة 
في نظرية القياس الكلاسيكية» قد نعرف (على سبيل Jb!‏ من أدائها في التحليل العاملي 
أو حسابات معامل ألفا) ما إذا كان بند ما يعمل بشكل جيد أو ضعيف ولكن قد لا يكون 
لدينا فهم واضح لطبيعة أي أوجه قصور لديه. LLL‏ قد تساعدنا طرق نظرية الاستجابة 
للبند IRT‏ على تقييم نقاط القوة والضعف في بند ما بشكل أكثر تحديدًا. 
تطبيق نظرية الاستجابة للبند IRT‏ على البنود متعددة الاستجابة: 

تنطبق مقدمة نظرية الاستجابة للبند المقدمة أعلاه على نماذج ثلاثية ا معلمات وتتعامل 
مع الاستجابات ثنائية التفرع» dio‏ صح أو خطأ. كما اقترح سابقاء هناك العديد من نماذج 
نظرية الاستجابة للبند. وإنه من الشائع في العلوم الاجتماعية والسلوكيةء Lil‏ نتعامل مع 
أنواع من خيارات الاستجابات المرتبة ومتعددة المستويات والتي تمت مناقشتها بوجه عام 
في الفصول السابقة. 

بالنسبة للأدوات GIS‏ خيارات الاستجابة متعددة المستويات» مثل مقاييس ليكرت Likert‏ 
يتم تطبيق نماذج نظرية الاستجابة للبند IRT‏ المكيفة بشكل خاص لتلك الأدوات. أحد أكثر 
هذه النماذج شيوعًا هو نموذج الاستجابة المتدرج graded response model‏ الذي طورته 
Fumiko Samejima‏ (على سبيل (Samejima,1969 JELI‏ ويطبق بشكل شائع عن طريق 
برنامج g .(Thissen Chen & Bock, 2003) David Thissen's Multilog software‏ 
هذا النموذج معلومات حول LAS‏ ارتباط كل LS‏ من خيارات الاستجابة المتعددة بالقدرة. 


تطوير المقاييس: النظرية والتطبيق YAV‏ 


الفصل السابع 


فبالنسبة للبند الجيده يجب أن يشغل كل خيار استجابة جزءًا Doaze‏ أو أقل من القدرة 
المقاسة. 

افترضء على سبيل المثال» بنداً مثل ”أشعر بالدوار عندما أستيقظ للمرة الأولى في الصباح“ 
وله خيارات الاستجابة التالية: (Y) “Hols” (1) M)‏ ”بعض الوقت"» (P)‏ ”معظم 
الوقت“ و(٤) LRI”‏ تقريبًا“. يتوقع المرء أن احتمال اختيار خيارات أعلى تدريجيًا على 
المقياس يرتبط مستويات أعلى تدريجيًا من الدوار (الدوخة) الصباحي gl)‏ مستويات As]‏ 
تدريجيًا من السمة محل التقييم). بطريقة ماء يحل بند مثل هذا محل العديد من البنود 
ثنائية الاستجابة. لذاء فبدلاً من البنود الثنائية من النوع ”نعم - لا“ المنفصلةء مثل ”لا أشعر 
بالدوار Iu}‏ عندما أستيقظ للمرة الأولى في الصباح"» ”نادرًا ما أشعر بالدوار عندما أستيقظ في 
الصباح“» ”في بعض الأحيان أعاني من الدوار عندما أستيقظ في الصباح“. وهكذاء يتم تقديم 
بند واحد له العديد من خيارات الاستجابة التي يمكن للشخص المستجيب الاختيار من بينها. 


إذا كان البند يعمل بشكل جيد على مجتمع معينء فإن احتمالية اختيار خيار الاستجابة 
الأول (أي (IL?‏ يجب أن تكون مرتفعة للأشخاص ذوي المستويات المنخفضة للسمة 
(الدوخة) ويجب أن Jelas‏ فعلياً إلى الصفر مع الزيادة في مستوى السمة. UY‏ ينبغي 
أن يكون المنحنى الذي يمثل احتمال اختيار خيار الاستجابة الأول عالياً في أقصى اليسار 
(المنطقة المقابلة لمستويات منخفضة من الدوخة في الصباح) ومنخفض عند أقصى اليمين. 
في الطرف الآخر من المقياس, يجب أن يكون احتمال اختيار خيار الاستجابة الأخير (أي 
Gio (“Ga Lalo”‏ تقريبًا للأشخاص في المستويات المنخفضة إلى المتوسطة من dowd!‏ مع 
التقدم والاقتراب من نسبة “٠٠١‏ من احتمالية الدوخة للأشخاص الذين يعانون من أعلى 
مستويات الدوخة في الصباح. يجب أن يكون منحنى هذه الاستجابة منخفمًا للغاية عند 
النهايات ال منخفضة من مستويات الدوخة الصباحيةء بحيث يصل إلى الحد الأقصى للقيمة 
عند أقصى اليمين من مستويات الدوخة. وبالتالي» فإن منحنيّي كل من هذين الخيارين 
للاستجابة القصوى غير متناظرة nonsymmetrical‏ حيث إن أحد الطرقين منخفض للغاية 
والآخر مرتفع جداً. ails‏ يجب وضع JS‏ من هذين المنحنيين على أقصى حد من النطاق 
المطابق لمستوى السمة التي يمثلها خيار الاستجابة. على النقيض من BUS‏ يجب أن تكون 
المنحنيات التي تقع بين خيارات الاستجابة متماثلة إلى حد de‏ مع احتمال منخفض لاختيار 


YM‏ تطوير المقاييس: النظرية والتطبيق 


نظرة dole‏ على نظرية الاستجابة للبند (IRT)‏ 


المستجيبين للخيارات الواقعة عند أطراف السمة واحتمال عال عند نقطة ما على النطاق 
المناسب لخيار الاستجابة للبند المعني. بالنسبة لخيارات الاستجابة الأعلىء يجب أن تظهر 
القمة عند مستويات أعلى من نطاق السمة مقارنةً بخيارات الاستجابة الأقل. 

يمكننا تصوير احتمالية اختيار كل خيار من خيارات الاستجابة» Fly‏ على مستوى 
السمة التي يتم قياسها لدى المستجيب» من خلال سلسلة من منحنيات الاستجابة للفئة 
.category-response curves‏ قد تبدو مجموعة كاملة من منحنيات الاستجابة للفئة 
الافتراضية لخمسة خيارات استجابة مستخدمة في المثال السابق بشكل يشبه ما هو موضح 
في الشكل رقم (۷-۷). 

في الرسم التوضيحي المثالي ا موضح في الشكل رقم (V-V)‏ يتوافق كل منحنى مُعلّم برقم 
مع خيار الاستجابة في Jio‏ الدوخة الصباحية الموضح سابقًا. هثل خط الأساس قوة السمة 
التي يتم قياسها من خلال البند. ويتركز مقياس القدرة عند الصفر ويمكن تفسيره بطريقة 
تشبه الدرجات ال معيارية. 








0 
السمة أوالقدرة 





شكل :(V-V)‏ منحنيات استجابة الفئة المثالية لخمسة خيارات استجابة 


تطوير المقاييس: النظرية والتطبيق ۸4 


الفصل السابع 


لاحظ أن هذا الشكل التوضيحي هو مثال مثالي وليس شكلاً ily‏ حقيقيًا مبني على 
بيانات فعلية. يحتفظ هذا المثال بخاصية منحنيات استجابة البند الحقيقية: بالنسبة لأي 
مستوى من dod!‏ فإن مجموع المنحنيات المختلفة عند تلك النقطة على خط الأساس 
يساوي واحد. لذلك» GV‏ خط رأسي مرسوم عند أي نقطة على مقياس السمة. فإن القيم 
(من المحور الواقع على الجهة اليسرى) للنقاط التي يعبر بها ذلك الخط منحنيات استجابة 
الفئة سيكون مجموعها يساوي الواحد الصحيح. بمعنى آخرء فإن احتمال اختيار استجابة 
ما يساوي الواحد الصحيح GY‏ مجيب بمستوى من السمة محل القياس. 

يوضح الشكل رقم (A-V)‏ مثالاً أقل مثالية ولكنه لا يزال افتراضيًا. يشير موقع منحنى 
كل خيار من خيارات الاستجابة الواقعة على امتداد بُعد السمة إلى ”صعوبة“ ذلك 
الخيار. وهكننا أن نرى أن القمة لكل منحنى من منحنيات LS‏ الاستجابة المتتالية 
مرتبة كما كنا نتوقع» وتقع خيارات الاستجابة التي تشير إلى دوخة صباحية أقل على يسار 
خيارات الاستجابة التي تشير لدوخة صباحية أكثر. وهذا يعني أن الإشارة إلى المزيد من 
الدوار مرتبط بمنحنى يقع إلى الأعلى (أي إلى أقصى اليمين) على امتداد نطاق dowd)‏ كما 
كنا نأمل. خاصية أخرى ملحوظة في الشكل رقم (A-V)‏ هي أن منحنيات الاستجابة تبدو 
مزدحمة نحو الجانب الأيسر من المقياس. وهذا يعني أن السؤال هيز بشكل أكثر دقة 
بين الأشخاص الذين يعانون من دوخة قليلة Gu‏ مقارنة بالأشخاص الذين يعانون من 
الدوار كثيرا. إذا أخذنا بعين الاعتبار النطاق على مقياس السمة الواقع بين )-0,* و-6,١)»‏ 
فإننا نرى أن جميع خيارات الاستجابة الخمسة يتم اختيارها أحياناً من قبل المستجيبين 
الذين لديهم ذلك النطاق من قيم الدوخة: على الرغم من أن خيارات الاستجابة ١‏ و٠‏ 
يتم اختيارها في أغلب الأحيان. علاوة على HS‏ من المحتمل أن يختار من هم في النهاية 
العليا (أقصى اليمين) الخيار Y‏ (”معظم الوقت“). في حين أن ا موجودين في الطرف السفلي 
(أقصى اليسار) سيختارون الخيار ١‏ (”نادرًا“). وبالتاليء حتى ضمن هذا النطاق «Sea!‏ 
لا يزال بإمكاننا إجراء تمايز بين الأشخاص الذين هم أعلى وأقل فيما يتعلق بالدوخة. 
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بند افتراضي ضعيف الأداء 

















شكل (۸-۷): مثال افتراضي بمنحنيات استجابة الفئة مزدحمة عند الطرف السفلي (الجهة اليسرى) من 
مقياس السمة 


في المقابلء إذا نظرنا إلى موقع أبعد على مقياس السمة. في حدود ما بين Ptg 7,١‏ 
فإن الاحتمال الغالب هو أن المستجيبين الذين لديهم مستويات دوار في أي موقع بين تلك 
القيمتين سيختارون الخيار > («تقريباً (Glo‏ في الواقع. «تقريباً Gl‏ هي الاستجابة 
الأكثر احتمالًا لأي مستجيب يحقق أعلى من ٠,۸‏ على مقياس السمة. وبالتالي» يوفر هذا 
البند تمييرًا بسيطًا بين الأشخاص الذين يحققون ما بين ٠,۸‏ و٠٠‏ بالنسبة لمستويات الدوخة 
لديهم. منحنيات الاستجابة للبند في الشكل (A-V)‏ لديها الكثير لتخبر عنه. لاحظ أن 
منحنى استجابة الخيار Y‏ («بعض الوقت») تتداخل قليلاً مع منحنيي الاستجابة للخيار ١‏ 
(«نادرًا») والخيار Y‏ («معظم الوقت»). لا يوجد Gled‏ جزء من نطاق القدرة الذي يكون 
فيه خيار الاستجابة ۲«بعض الوقت» هو الأكثر احتمالًا للاختيار. وبشكل جوهريء OB‏ 
خيار الاستجابة ۲ «بعض الوقت» لا يقوم بأي شيء لا يمكن لخياري الاستجابة الواقعين 
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على جانبيه أن ينجزاه. لا يزال من المرجح أن يقوم المستجيب الذي حصل على درجة من 
الدوخة الصباحية تعادل الدرجة (-1,0) على مقياس السمة (النقطة التي من المرجح أن 
يختار المجيبون عليها خيار الاستجابة ۲ باختيار الخيار ١‏ أو Y‏ إن اختيار الخيار BY‏ هذه 
الحالة الافتراضية يؤدي إلى الغموض بين الدوخة النادرة والدوخة في بعض الأحيان. بالأخذ 
في الاعتبار هذا البند بشكل djei‏ وبغض النظر عن أي بنود أخرى قد يتم تضمينها مع 
هذا البند في اممقياس» فإن إس قاط خيار الاستجابة ۲ «بعض الوقت» من المحتمل أن يكون 
له معنى. 

شكل المنحنيات لخيارات الاستجابة يعطينا معلومات حول خاصية التمييز 
. وهذا يبدو أكثر وضوحاً بالنسبة للمنحنى الأخير والذي يشبه إلى حد 
كبير ا منحنيات التي قمنا بفحصها المتعلقة بنموذج الاستجابة الثنائية (اجتياز/افشل) ذي 
الثلاث معلمات LS)‏ هو موضح في الشكل (7-1)). المنحنى الموجود في أقصى اليسار هو 
نوع من صورة معكوسة طبق الأصل ما oloi‏ في نموذج المعلمات الثلاث من حيث إنه 
يصل إلى أعلى مستوياته في أقصى اليسار وينحدر مع التقدم للأعلى في مقياس السمةء ولكن 
مرة أخرىء فإن انحدار ميل ال منحنى يدل على درجة تمييزه للسمة. بالنسبة للمنحنيات 
الموجودة بين المنحنيات الطرفية» يشير الانحدار gl)‏ رها بدقة أكثر التفرطح (kurtosis‏ إلى 
درجة التمييز. خيارات الاستجابة التي تكون منحنياتها مرتفعة ومدببة تميز بشكل أفضل 
من تلك التي تكون منحنياتها أكثر اتساعًا وانبساطاً. في الشكل رقم (A-V)‏ خيار الاستجابة 
۲ (”بعض الوقت") له منحنى على شكل القرفصاء إلى حد cle‏ مما يشير إلى أن خيار 
الاستجابة jug Y‏ بشكل جيد. هذا يدعم WIS‏ فكرة أن حذف هذا الخيار قد يكون مناسباً. 

لاختتام هذا القسم» سننظر في منحنيات الاستجابة GLAU‏ (الخيارات) الناتجة عن 
بيانات فعلية (تم توفيرها واستخدامها USL‏ من زملائي دارين دي ولت Darren DeWalt‏ 
وديفيد يسن David Thissen‏ من جامعة (UNC‏ وسوف نستخدم هذه المنحنيات 
لتوضيح الغرض الآخر الذي مكنها تقدهه. بمثل الشكل رقم (۹-۷) بنداً تم تطبيقه على 
مجموعة من ال مرضى الأطفال من GLY!‏ كجزء من جهد لتطوير مجموعة بنود لتقييم 
الاكتئاب. هذا البند يطلب من الأطفال الإشارة إلى عدد المرات التي بكوا فيها أكثر من 
ا معتاد في الماضي القريب. على نحو مشابه لكن غير مطابق لأمثلتنا السابقةء كانت 
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خيارات الاستجابة هي صفر (“LS 583 I) ١و (“II”)‏ و۲ (“Gol”)‏ و" (”غالباً“) وع 
lo”)‏ تقريبًا“). يشير تجمع ال منحنيات إلى اليمين إلى أن ا مشاركين يجب أن يكونوا على 
درجة عالية من السمة (أي الاكتئاب) من أجل تقديم إجابة بخلاف SAP‏ 


بكيت AST‏ من ال معتاد - الفتيات 











(I-V) JSS‏ منحنيات استجابة الفئة للفتيات للبند المتعلق بالبكاء AST‏ من المعتاد 


يبيّن الشكل رقم +-V)‏ 1( استجابات الأولاد واستجابات الفتيات Lee‏ على نفس الشكل. 
على الرغم من أن هذا الشكل مزدحم للغاية» إلا أنه ALS‏ أن منحنيات YII‏ والفتيات 
متشابهة عمومًا ولكنها ليست متطابقة بأي حال من الأحوال. ولجعل الفارق الحاسم بين 
استجابات الأولاد والفتيات أكثر وضوحًاء في الشكل رقم »)١١-۷(‏ تم تحرير المنحنيات التي 
تمثل خيارات الاستجابات الوسطى BII‏ وتم الإبقاء فقط على تلك المنحنيات الخاصة 
بخيارات الاستجابة صفر Bho” ٤و LP‏ تقريبًا“. بالنسبة للخيار صفرء يكون منحنى 
الأولاد أعلى من الفتيات» bel‏ بالنسبة للخيار € فإن الفتيات ”أعلى من الأولاد“. 
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كيف يجب أن نفسر هذا الاختلاف؟ هذا الاختلاف يشير إلى أنه خلال المدى الكامل 
لقيم السمة (الاكتئاب)» فإن الأولاد AST‏ أرجحية من الفتيات للقول إنهم & يبكوا SÍ)‏ 
اختيار خيار الاستجابة ”أبدا) أكثر من المعتاد. في الطرف العلوي من مقياس السمة» تكون 
الفتيات أكثر احتمالية من الأولاد للاعتراف بأنهم يبكون أكثر من المعتاد Gla”‏ تقريبًا“ خلال 
الفترة الزمنية المعنية. 











شكل :)٠١-/(‏ منحنيات استجابة للفئة متداخلة للفتيان والفتيات للبند المتعلق بالبكاء AST‏ من المعتاد 


يشير هذا النمط إلى أحد أمرين: إما )١(‏ أن تكون الفتيات أكثر GESI‏ من الأولاد أو (؟) 
يولد مستوى منخفض من الاكتئاب استجابات أعلى لدى الفتيات منها لدى الأولاد. أي إن 
البند يعكس الفروق الحقيقية بين الجنسين بين الأولاد والفتيات أو أن البند لا يعمل بشكل 
متكافئ بين الجنسين. الشك لدينا هو أن الإقرار بالبكاء قد يكون أكثر صعوبة لدى الفتيان 
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منه لدى الفتيات. ونتيجة OLS UY‏ الأولاد الذين يختارون أي خيار استجابة بخلاف 
«أبدا» قد يكونون بالفعل GESI AST‏ من الفتيات اللاي يخترن خيار الاستجابة نفسه. وهذا 
يشير إلى أن البند يظهر أداء البند التفاضاي (DIF) differential item functioning‏ 
معنى أن المجموعات ال مختلفة من ال مجيبين YÄ)‏ والفتيات في هذه الحالة) الذين لديهم 
مستويات مماثلة من السمة يحصلون على درجات مختلفة للبند. مما يشير إلى أن البند 
يحدد على مقياس السمة بشكل مختلف كدالة في مجموعة الجنس. من خلال النظر إلى 
البنود الأخرى التي تقيس الاكتئاب والتي لا تسأل عن البكاء ومن خلال ملاحظة النتائج 
ا متشابهة بشكل أساسي للبنين والبنات» وجدنا Blo] Wo‏ على أداء البند التفاضلي DIF‏ 
للبند المعني. بينما توجد طرق أخرى لتحديد أداء البند التفاضلي DIF‏ يجد العديد من 
الباحثين ا معلومات المرئية التي تنتجها حزم نظرية الاستجابة للبند IRT‏ لتكون مقنعة 
بشكل خاص. 

خلاصة gill‏ مكن أن يوفر فحص منحنيات استجابة الفئات معلومات من عدة أنواع 
حول slol LAS‏ بند ما. ومن بين الأشياء الكثيرة التي هكن أن يكشف عنها فحص منحنيات 
الاستجابة للفئة (أ) معلومات حول مدى التمثيل الكلي لبند ما للمجموعة الكاملة للخاصية 
التي يتم قياسهاء (ب) ما إذا كانت خيارات الاستجابة المرتبة تمثل Bay‏ المناطق الأعلى من 
مقياس السمة بشكل تدريجي» (ج) ما إذا كانت جميع خيارات الاستجابة ضرورية ومفيدة, 
(د) مدى قدرة sid!‏ على التمييز بشكل جيد عند مستويات مختلفة من السمة. و(ه) ما 
إذا كان البند يظهر slol‏ البند التفاضلي DIF‏ يمكن الحصول على أنواع أخرى من المخرجات 
الرسومية من العديد من حزم نظرية الاستجابة للبندء ويكون التمثيل GA‏ لأداء العنصر 
من بين أكثر ميزات IRT‏ فائدة. 


Theta and Computerized) المحوسب‎ ASW) والاختبار‎ Lis 
:Adaptive Testing (CAT 

في قلب كل أساليب القياس» هناك مفهوم أن قوة السمة التي يتم قياسها تختلف 

باختلاف الأفراد أو الوقت» ونظرية الاستجابة للبند IRT‏ ليست استثناءً من ذلك. 
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dy‏ وقت سابق من هذا الفصلء تم استخدام مصطلح ”القدرة“ لوصف Jio‏ هذه السمة. 
وغالبًا ما يشار إلى هذه السمة. Spa;‏ النظر عن محتواها ا موضوعيء ب ”ثيتا“ في سياق 
نظرية الاستجابة للبند IRT‏ ويمكن الإشارة إليها بالحرف اليوناني الكبير ©. كما ذكر 
سابقًا في هذا الفصلء يمكن إنشاء البنود بحيث يكون لها مستويات مختلفة من الصعوبة. 
وبشكل qgulul‏ تتم معايرة الصعوبة من حيث ثيتا. وبالتالي» فإن الاستجابة الإيجابية لبند 
أكثر صعوبة gl)‏ اختيار خيار استجابة Lig‏ قيمة (Hel‏ تعني أن المستجيب لديه قيمة ثيتا 
أعلى (أي أنه يمتلك مستوى el‏ من السمة التي يقيمها البند) نسبيًا للمستجيبين الذين 
يؤيدون فقط البنود المرتبطة بقيم ثيتا الأقل. بالنسبة لكل بند. يمكن محلل البيانات 
تحديد مستوى gl)‏ نطاق) قيم ثيتا التي هيز البند عندها بين المشاركين مستويات مختلفة 
من السمة. بعض البنود قد تعمل بشكل جيد عبر مجموعة واسعة من قيم ثيتاء بينما بنود 
أخرى ستعمل بشكل جيد فقط عبر نطاق ضيق من ثيتا. 

إن بنداً افتراضياً مثل «أنا قلق على مستقباي» مقروناً بخيارات الاستجابة )+( di»‏ 
)1( «القليل من الوقت» (Y)‏ «معظم الوقت» و(2)) «Gilo»‏ قد يكون قادرًا على توفير 
dole dock‏ للسمة التي يقيمها عبر نطاق واسع من ثيتا. ومع US‏ قد لا يفرق بشكل جيد 
للغاية بين التقديرات الأصغر للخاصية. rarely Lol Jis‏ ما تشعر بالمحتوى وقلّما seldom‏ 
(معنى أكثر بقليل من نادراً) تشعر با محتوى. قد يختار الأشخاص في كل من هذين 
المستويين الأخيرين من القلق على ا مستقبل ”القليل من الوقت“ وبالتالي لا مكن للبند 
تمييز الفرق الدقيق في ”القلق على المستقبل” login‏ ولكن بالنسبة لبعض التطبيقات. قد 
يكون التمييز بين الأفراد أصحاب الخيارات الدقيقة ”نادراً ما“ rarely‏ و”قلما“ seldom‏ 
يعتبر أمرا daly lage‏ يمكن إنشاء بنود إضافية تركز بمزيد من التفصيل على جزء أقصر 
من النطاق الكامل للسمة. قد يكون لهذا البند خيارات إجابة مثل Ia)?‏ و”نادرًا Ne‏ 
و”نادرًا“. و” قلما“ و”من حين لآخر“. أو قد تتم إعادة صياغة أصل البند نفسه لاستهداف 
مستوى مختلف من ثيتا. على سبيل SU‏ ”لدي شعور بالفزع Sle‏ مستقبلي“ يثير 
بوضوح المخاطر. Gl‏ من هذين النموذجين البديلين للبند قد يركز على المستويات الأعلى 
لسمة القلق أكثر من البند الأصلي. 
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في الواقع» يمكن تطوير مجموعة من البنود من هذا النوع تستهدف أجزاء مختلفة 
من سلسلة قيم ثيتاء بعضها يركز في المقام الأول على ا مستويات المنخفضة. والبعض الآخر 
على المستويات المتوسطة. والبعض الآخر على مستويات عالية من القلق. من المحتمل 
أن تتفوق مجموعة كبيرة ومصاغة بشكل متقن من هذه البنود على عدد أقل من البنود 
العامة. liag‏ يعني أن هذه المجموعة الموسعة من البنود هكن أن تحل الاختلافات الأصغر 
في ثيتا بدقة أكبر (أي تفريق المجيبين الذين كانت مستويات قلقهم (Glis AST‏ بالإضافة 
إلى تمديد النطاق الكامل لثيتا agf)‏ تضمين بنود مستهدفة لعدة مستويات مختلفة من 
القلق تتراوح من منخفض للغاية إلى مرتفع للغاية). المشكلة في هذه الإستراتيجية هي 
أنها تتطلب Bas‏ كرا من البنود. علاوة على US‏ قد يضطر أي مجيب معين إلى JUSI‏ 
ous‏ كبير من البنود التي كانت خارج نطاق ثيتا الخاص به He)‏ سبيل SEL‏ يتعلق ذلك 
مستويات أعلى أو أقل من السمة من تلك التي هتلكها المجيب). هذا من المحتمل أن 
يكون له ضريبة على المجيبين الذين قد يشعرون بالضجر من استكمال العديد من البنود 
والذين ربما يكونون منزعجين من البنود التي لا تنطبق على ظروفهم. إن إدراك هذه 
المشاكل المحتملة قد يلزم مطوري المقياس إما باختيار مجموعة أقصر من البنود التي قد لا 
تؤدي مهمة جيدة لاكتشاف الاختلافات الأكثر دقة في ثيتاء أو باختيار أداة أطول تميز بدقة 
أكبر ولكن من المحتمل أن تكون أكثر كلفة. 

يقدم الاختبار التكيفي المحوسب Ge (CAT)‏ ممكنّا oig)‏ ا معضلة. في CAT‏ تم 
تطوير بنك كبير من ogil‏ وتتم معايرة كل منها بعناية بحيث تكون قيمة theta‏ التي 
تتوافق معها معروفة. يكمل المجيبون البنود عبر الكمبيوتر» مع تحديد خوارزمية مسبقة 
الضبط بشكل تكيفي لتحديد عدد البنود المعروضة وترتيبها. البنود القليلة الأولى Sole‏ ما 
تكون dole‏ إلى حد clo‏ ولا تسفر إلا عن فكرة تقريبية عن مستوى المجيب من السمة التي 
يجري تقييمها. استنادًا إلى الإجابات على تلك البنودالأوليةء هكن لخوارزمية الكمبيوتر 
تقديم البنود التالية بشكل انتقائيء واختيار تلك البنود الموجودة ضمن مجموعة البنود 
المتوفرة الأكثر dbo‏ والغنية با معلومات لمستوى ثيتا التي يبديها ا مستجيب المحدد. معنى» 
مستوى السمة التي كشفت عنها الاستجابات السابقة. لذلك» على سبيل SEL!‏ إذا كانت 
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الاستجابات الأولية تشير إلى أن المجيب يقلق بشأن مستقبله أكثر من معظم الأشخاصء 
فيمكن اختيار البنود التي تركز على مستويات أعلى من القلق بينما يمكن حذف البنود التي 
تستهدف مستويات منخفضة للغاية. مع استمرار التقييم» يمكن للكمبيوتر تحسين اختيار 
البنود. مع التأكد من أن البنود المعروضة dbo GIS‏ بمستوى سمة المجيب وكافية في العدد 
لتوفير وصف دفيق. 

بالمعنى الحرفي للكلمة» لا يعتمد الاختبار التكيفي من هذا النوع على استخدام 
نهج نظرية الاستجابة للبند IRT‏ في الواقع: قبل تطوير هذه الأساليب بفترة طويلةء 
استخدمت اختبارات الذكاء الموحدة استراتيجية مماثلة لطرح بعض الأسئلة ”محددة 
اموقع“ («locator» questions)‏ لتحديد أي من الأسئلة المتعلقة منطقة معينة من الذكاء 
يجب طرحها وتحديد عددها. ومع US‏ فإن القدرة التي يوفرها نهج IRT‏ معايرة البنود 
لمستويات محددة من ثيتا (وللتعبير عن هذه ال معلومات من الناحية الكمية). إلى جانب 
قدرة أجهزة الكمبيوتر على الاستفادة في الوقت الفعلي من مجموعة الاستجابات المقدمة 
واستخدام تلك البيانات لتحديد البند التالي الذي سيتم تقدهه» زادت بشكل كبير من فائدة 
واعتماد الاختبار التكيفي. 

الاختبار التكيفي المحوسب CAT‏ هكن أن يكون جذاباً للغاية عندما يكون ذلك ممكنًا. 
وهو يتطلب وجود بنك كبير من البنود التي تم اختبارها بشكل كاف لتوفير معايرة جديرة 
بالثقة. Las)‏ تحتاج خوارزميات CAT‏ إلى حساب خصائص البند بخلاف نتائج المعايرة. على 
سبيل JELI‏ قد يؤدي الاختيار على أساس ثيتا إلى التضحية دون قصد بنطاق المحتوى إذا 
تم استبعاد البنود التي تمثل بنوداً مهمة للمفهوم البنائي (construct)‏ قيد الفحص. لا تزال 
الدراسات التجريبية التي تقارن CAT‏ مع استخدام مجموعات البنود الثابتة نادرة Guus‏ 
على الرغم من أن التقارير المتاحة تشير إلى وجود ميزة ل CAT‏ مقارنة مجموعات البنود 
الثابتة ذات الحجم المتواضع (Choi, Reise, Pilkonis, Hays, & Cella, 2010 Ute)‏ 
يبدو من المحتمل أنه كلما كان نطاق المحتوى موضع اهتمام SI‏ وكلما كانت مستويات 
السمة أكثر تقلبًا بين شرائح مختلفة من ال مجتمع» فإنه من ا ممكن أن تكون فوائد الاختبار 
التكيفي ا محوسب CAT‏ أكبر. 
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للحصول على نظرة أكثر شمولاً على الاختبار التكيفي المحوسب CAT‏ مكن للقراء 
الرجوع إلى )2007( .Bjorner, Chang, Thissen, and Reeve‏ المجلد الأخير الذي os‏ 
للقراء استخدامه لتعزيز فهمهم لمجموعة واسعة من موضوعات نهج نظرية الاستجابة 
للبند IRT‏ هو كتيب نمذجة نظرية الاستجابة للبند: تطبيقات لتقييم الأداء النموذجي 
Handbook of Item Response Theory Modeling: Applications to Typical‏ 


.Performance Assessment (Reise & Revicki, 2015) 


تعقيدات نظرية الاستجابة للبند SIRT‏ 

على الرغم من أنها جذابة LeU‏ فإن نظرية الاستجابة للبند IRT‏ ليست حلاً سريعًا 
ممشاكل القياس. مثل نظرية القياس الكلاسيكية CTT‏ لا تحدد IRT‏ خصائص البنود؛ إنها 
مجرد قياس كمي للبنود. لذاء فإن التكنولوجيا في حد ذاتها تسمح للباحث بتقييم أداء 
البند لكنها لا تتسبب بشكل مباشر في كتابة بنود أفضل أو جعل البنود التي تم إنشاؤها 
بشكل سيء تعمل فجأة بشكل جيد. أيضاً يمكن أن تكون عملية التقييم BLS‏ عند 
استخدام طرق تعتمد على IRT‏ القياس الكلاسيكي يضحي بالدقة لأجل البساطة من خلال 
تبني تصورات أقل LOLS‏ ولكن أكثر تعقيدًا jalab‏ الخطأ. بينما تقوم نظرية الاستجابة 
للبند IRT‏ بالخيار العكسي» واكتساب الدقة مقابل التضحية بالبساطة. علاوة على US‏ 
يتطلب تطبيق طرق IRT‏ درجة كبيرة من قرار الخبراء. لا تزال هذه الطرق في مرحلة 
التطوير النشطة. مع ظهور مشكلات جديدة وتقديم حلول جديدة. 

وللحصول على الثقة بأن خصائص البنود يتم تقييمها بشكل مستقل عن خصائص العينة 
التي تتم دراستهاء وهو الهدف الأساسي IRTI‏ يجب على المرء أن يثبت أن هذه الخصائص 
متسقة عبر مجموعة واسعة من المشاركين الذين يختلفون في نواح مختلفة: ما في ذلك 
معو القدرة.. ومين pails L555 Vi pall‏ البثد خصائص اة الأخترى المسسفلة عن 
السمة. مثل الجنس أو العمر أو المتغيرات الأخرى التي يجب أن تكون غير مرتبطة مع تلك 
التي يتم قياسها. يجب أن تختلف درجات البنود فقط عندما تتغير السمة محل الاهتمام 
وليس بسبب الاختلافات في أي متغيرات خارجية المنشأً «UU extraneous variables‏ 
على سبيل JEL‏ إذا افترضنا أن القدرة الإملائية spelling‏ لا علاقة لها بالجنس» فسيتعين 
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علينا إثبات أن Vo!‏ والبنات ذوي القدرة المتساوية سيكون لديهم نفس الاحتمال في 
اجتياز بند ما. إذا مم يكن هذا صحيحًاء فسيؤثر نوع الجنس أو بعض العوامل الأخرى 
بخلاف القدرة الإملائية على البند. أيضًاء كما هو الحال مع النظرية الكلاسيكيةء يجب أن 
تشترك البنود التي يتم فحصها في مجموعة (أي تكوين مقياس لقياس المتغير) في متغير 
أساسي واحد فقط. 


إحدى نتائج هذه المتطلبات هي أنه يجب على الباحثين الوصول إلى أعداد كبيرة من 
المجيبين المتنوعين من أجل وصف البنود بدقة. الهدف الرئيسي ل IRT‏ هو ربط البنود 
بمستويات محددة من السمة التي يتم تقييمها. البنود الجيدة والعينات الكبيرة ضرورية 
لتحقيق ذلك. تتطلب الاستقلالية النظرية لخصائص البنود وخصائص العينة التي تعد سمة 
مميزة ل IRT‏ أن يكون قد تم تقييم البنود عبر النطاق الكامل للسمة محل الاهتمام وأن 
أداة القياس تتضمن بنوداً حساسة بشكل شامل لجميع مستويات تلك السمة. 

كيف يتحقق مطور أدوات القياس من المستوى الحقيقي للسمة بطريقة تسمح بتكوين 
ا منحنيات المميزة SICCs ogi‏ بالعودة إلى تشبيه ال مطرقة والجرسء كيف ممكنك تحديد 
القوة من أجل تحديد مقدار القوة التي يتطلبها قرع الجرس لطرق جزئية معينة من 
الجهاز؟ في كثير من الحالات» إذا كان المستوى الحقيقي للسمة معروقًا بطريقة يمكن 
التحكم فيهاء فلن تكون هناك dole‏ كبيرة لتطوير مقياس جديد. من الناحية Ay BI‏ 
نظرًا لاستجابات عدد كبير من الأشخاص لمجموعة ثابتة من البنود. يجب أن يكون برنامج 
الكمبيوتر قادرًا على فرز الاختلافات الناشئة عن خصائص البند مقابل خصائص الشخص. 
للعودة مرة أخرى إلى تشبيه أجهزة الكرنفال (جهاز رنين الجرس وآلة الغمر)» إذا استخدم 
sus‏ كاف من الأشخاص YS‏ من الجهازين» على سبيل ال مثال» يجب أن يكون من الممكن 
تحديد أي من الجهازين أصعب» وأيضًاء للحكم على مهارات الأفراد في هاتين المهمتين. 
في الممارسة العمليةء غالبًا ما تكون هناك ihs‏ تكرارية متداخلة تتضمن إدارة البنود 
لقياس مستوى السمة مجيبين معينين» ثم استخدام تقدير السمة كدليل في تحديد خصائص 
البنود الأخرى. عندما يتم تحديد أفضل البنود على هذا الأساس» يمكن استخدامها للحصول 
على تقدير محسّن Db grub‏ الأفراد في السمة للجولة التالية من اختيار البنود» وهكذا. 
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نظرًا لطبيعة هذه العمليات» من السهل أن نرى السبب وراء تبني نظرية الاستجابة 
للبند IRT‏ بحماس شديد من قبل المؤسسات التجارية ا معنية باختبار القدرات. مثل تلك 
التي تدير اختبارات سجل الخريجين. يوفر التطبيق والتقييم المستمر للبنود بمرور الوقت 
Loli‏ ممتارًا للعثور على البنود التي تتسم خصائصها بالاستقرار خلال التباين في مجموعة 
واسعة من خصائص ال مستجيبين الأخرى. 

أحد التعقيدات الأخرى لنظرية الاستجابة للبند IRT‏ يتعلق باستخدام بنود مختلفة 
لقياس الشيء نفسه في أوقات مختلفة. في وقت سابقء ذكرت باختصار الاختبار التكيفي 
المحوسب (Van der Linden & Glas, 2000) (CAT)‏ كنهج لجمع البيانات المرتبطة 
We‏ ب IRT‏ في CAT‏ تتم معايرة البنود بشكل فردي hab‏ السمة باستخدام طرق 
IRT‏ وبالتاليء يمكن اختيارها للتطبيق بحيث تتوافق مع مستوى السمة لمجيب معين. هذا 
يعني أن البنود المختلفة ستكون مناسبة على النحو الأمثل لجوانب القوة المختلفة للسمة. 
يمكن أن تحدث مثل هذه الاختلافات إما بين الأشخاص الذين يختلفون فيما يتعلق بالسمة 
أو لفرد معين يتغير مستوى السمة الخاصة به. 

lls‏ فإن استخدام الاختبار التكيفي المحوسب lo WE CAT‏ يستلزم نتائج أو درجات 
من بنود مختلفة تتم مقارنتها مع بعضها البعض. على سبيل المثالء إذا تغيرت إحدى 
السمات كنتيجة للتدخلء فقد تختلف أفضل البنود لقياس تلك السمة في أي فرد بعد 
التدخل عن ذي قبل. بالنسبة للمستخدم لتقرير علمي يبني ادعاء نجاح التدخل على 
أساس مقارنة بين البنود المختلفة عبر (بسبب الاختلافات الأولية في السمة) وداخل (بسبب 
التغييرات الناتجة عن التدخل) الأفراد. فإن الوثوق ف البيانات قد يتطلب الإهان بذلك. 
يتمتع معظمنا بخبرة أكبر بكثير (وربما بالراحة) في الظروف التي تم فيها إعطاء البنود نفسها 
قبل وبعد التدخل مقارنة بالسيناريو الذي تم وصفه للتو. عندما يتم تطبيق طرق IRT‏ 
بشكل صحيح وتتم معايرة العناصر بعناية بالنسبة لسلسلة قيم السمة على أساس البيانات 
التي تم جمعها من عينات كبيرة ومتنوعة, فإنه مكن تحويل الدرجات الناتجة من بنود 
مختلفة إلى مقياس سمة شائع بنفس الطريقة التي يمكن من خلالها تحويل قياسات بالبوصة 
أو بالملليمتر إلى مقياس شائع للطول. عندما تكون BUI‏ التي يمكن بها تعيين البنود على 
بعد السمة منخفضة. فإن تفسير النتائج Elo‏ على مجموعات بنود مختلفة قد يكون مشكلة. 
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علاوة على WS‏ نظرًا OY‏ مستخدمي تقارير الأبحاث قد لا يفهمون LE‏ جميع المشكلات 
التي ينطوي عليها نوع مقارنات البنود المختلفة التي قد ينطوي عليها الاختبار التكيفي 
المحوسب CAT‏ فقد يواجه مؤلفو هذه التقارير درجة أكبر من الشك. 


الخلاصة: 

إن أساليب القياس القائمة على نظرية الاستجابة للبند 1۸1 لديها العديد من الميزات 
الجذابة. ولكن إنشاء البنود الجيدة هو عمل شاقء بغض النظر عن الإطار النظري الذي 
يوجه العملية. إن كتابة البنود التي تقيس السمة قيد الدراسة باتساق والتي لا تراعي 
خصائص ال مستجيب الأخرى ليست مهمة سهلة. بينما في المقاييس التي تعتمد على النظرية 
AS WISI‏ فإن وجود بنود متعددة يمكن أن يعوض عيوب بعض هذه البنود إلى حدٍ ماء في 
حين أن المنطق وراء نظرية الاستجابة للبند أن كل بند يتم الحكم عليه على حده. بسبب 
أنه هكن للمرء أن يكتشفء من خلال فحص المنحنيات المميزة للبنود (ICCs)‏ على سبيل 
SLAM‏ كون أداء أحد البنود جيدًا لا يعني أن ذلك المرء سيفعل ذلك. إن امتلاك معرفة 
مستقلة موثوقة بالخصائص التي يتم قياسها هو أحد متطلبات نظرية الاستجابة للبند التي 
يصعب الوفاء بها بدقة. ولكن يمكن تقريبها بشكل كاف بالاختبارات المتكررة للعينات 
الكبيرة وغير المتجانسة. وبالتالي عندما لا يكون هذا HLS‏ فقد يكون من الصعب للغاية 
إقناع النقاد بأن الافتراض قد تحقق بشكل كاف. 

وجهة نظري الشخصية هي أنه عندما تكون افتراضات نظرية القياس الكلاسيكية CTT‏ 
قابلة للتطبيق Cur asl)‏ يتم تصميم البنود كمؤشرات مكافئة ممتغير أساسي مشترك)» OB‏ 
قابلية التتبع والأداء لهذه المقاييس تجعلها خيارات جذابة. من dob‏ أخرىء في حالة 
توفر عينات كبيرة (والتي ash‏ عندها الاختبار التكيفي المحوسب CAT‏ طريقة مفضلة 
للتطبيق)» أو في حالة أن الدرجات المكافئة في دراسات متعددة تكون GIS‏ أهمية قصوى, 
فإن الأساليب القائمة على IRT‏ في ظل وجود التعقيد المضاف قد تكون هي الخيار الأفضل. 
ومع ذلك» فإن مجرد استخدام هذه الأساليب ليس ضمانًا للمنتج النهائي المنشود. ويجب 
على الباحث أن يثبت أن افتراضات الطريقة المختارة قد تم الوفاء بها ضمن حدود مقبولة 
وأن ثبات reliability‏ أداة القياس الناتجة وصدقها ALB validity‏ للتحقق منها تجريبيا. 


Yey‏ تطوير المقاييس: النظرية والتطبيق 


نظرة dole‏ على نظرية الاستجابة للبند (IRT)‏ 


هل تجعل نظرية الاستجابة للبند الأساليب الكلاسيكية قدهة؟ يدرك العديد من مؤيدي 
نظرية الاستجابة للبند أن لكل من نظرية القياس الكلاسيكية ونظرية الاستجابة للبند دور 
تلعبه. على سبيل JEL‏ ذكر )1999( Embretson & Hershberger‏ في أول توصياتهما 
المتعلقة بالتغييرات في أساليب القياس الحالية» أنه يجب دمج نظرية الاستجابة للبند 
والأساليب الكلاسيكية CTT‏ في نهج شامل لقضايا القياس. (YOY yo)‏ 


على الأقل» خلصت دراستان تجريبيتان كبيرتان )2003 (Fan, 1998: Stage,‏ التي قارنت 
خصائص الاختبارات التربوية القائمة على الأساليب الكلاسيكية ونظرية الاستجابة للبند 
إلى أن الأساليب الكلاسيكية Gol‏ بشكل جيد أو أفضل من الأساليب القائمة على نظرية 
الاستجابة للبند. استندت دراسة )1998( Fan‏ إلى +€ äus‏ كل منها مكونة من ٠٠٠١‏ فردء 
مأخوذة من مجموعة تضم حوالي 97٠٠١‏ اتلميذ من تكساس تم اختبارهم في مهارات 
القراءة والرياضيات. وقد أظهرت خصائص البند والشخص اتسافًا كبر عبر الأساليب. قامت 
Stage (2003)‏ بمقارنة الطرق التقليدية وطرق نظرية الاستجابة للبند باستخدام بيانات من 
اختبارات القدرات القياسية السويدية Swedish Standard Aptitude Tests‏ واستناداً إلى 
dus‏ من YEE)‏ من المتقدمين للاختبارات تم اختيارهم عشوائياً من مجموعة من 2170١07‏ 
خلصت إلى أنه في حين أن نموذج نظرية الاستجابة للبند المكون من ثلاثة معلمات كان 
متوافقاً golfit)‏ البيانات بشكل ضعيف» فإن نموذجًا UE‏ على نظرية الاختبار الكلاسيكية 
كان جيدًا. في الآونة الأخيرةء أجرى )2009( Silvestro-Tipay‏ دراسة مماثلة ولكنها أصغر 
باستخدام درجات اختبار ل 177 طالباً جامعياً من طلبة السنة الأولى. وقد خلص إلى أن: 

النتائج هنا توضح ببساطة أن إطاري القياس ينتجان إحصائيات متماثلة لكل 

بند وشخص سواء من حيث قابلية المقارنة بين إحصاءات البند والشخص» ومستوى 

صعوبة البنودء والاتساق الداخلي, وأداء البند التمييزي بين إطاري العمل. (ص ۲۹). 
وعلى نفس lgibl‏ قدم باحثان من dots‏ الاختبارات التربوية ومجلس الكلية مؤخرًا 
ورقة تصف نتائج دراسة محاكاة قارنت طرق نظرية الاستجابة للبند والأساليب الكلاسيكية 
مع تحدید نماذج الاختبار )2010 .(Davey & Hendrickson,‏ وخلصوا إلى أن ”كلا النهجين 
يوفران مزيجًا his‏ للاهتمام من المزايا والعيوب النظرية والعمليةء مع عدم ظهور أي منهما 

كمفضل واضح على الورق“. وقد لاحظوا كذلك أنه: : 
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كانت النتيجة الأكثر وضوحاً للدراسة هو الفرق البسيط نسبياً بين أداء 
طرق الكلاسيكية ونظرية الاستجابة للبند .... قد يعني التشابه في الأداء لتلك 
الأساليب أن اختيار الممارس يعتمد إلى حد كبير على التفضيل أو الملاءمة 
التشغيلية. (ص (Y‏ 


لا ينبغي تفسير هذه التقارير على أنها تشير إلى أن أساليب نظرية الاستجابة للبند 
ليست لها مزايا في أي موقف. لا شيء من هذه الدراسات قطعي» وبعض هذه الاختلافات 
تم تحديدها عند مقارنة تلك الطرق. تحليلات نظرية الاستجابة للبند في بعض الحالات 
قدمت معلومات أكثر تفصيلاً من التحليلات الكلاسيكية. وكما رأينا في الرسوم البيانية 
للبنود متعددة الاستجابات» يمكن لطرق نظرية الاستجابة للبند أن تقدم رؤى مفيدةء مثل 
الإشارة إلى أن جميع خيارات الاستجابة ليست ضرورية أو أن البند لا يلتقط معلومات عبر 
النطاق الكامل للسمة التي يتم قياسها. توفر طرق نظرية الاستجابة للبند Las}‏ ميزات 
نظرية واضحة (مثل استقلال خصائص البند عن خصائص (digs!‏ ومع تحسن dL‏ 
قد يتم تقليص بعض العوائق العملية. ولكن كحد dal‏ تجادل هذه الدراسات أن طرق 
نظرية الاستجابة للبند ليست بالضرورة أفضل من طرق القياس الكلاسيكية. باختصارء إن 
تقارير زوال القياس الكلاسيكي سابقة لأوانها. 
ولتناول مزايا وعيوب كلا الطريقتينء لاحظ )2008( :Zickar and Broadfoot‏ 
كما أن طرق نظرية القياس الكلاسيكية CTT‏ لها قيودها doll‏ لاحظ 
الباحثون وجود قيود شديدة على طرق نظرية الاستجابة للبند IRT‏ التي 
تجعل استخدام أساليبها صعبة أو مستحيلة أو غير عملية في سيناريوهات 
معينة. تتضمن هذه القيود الحاجة إلى أحجام كبيرة للعينات» وافتراضات 
قوية لأحادية البعد unidimensionality‏ [وهو ما ينطبق أيضًا على 
الأساليب [ASUS‏ وصعوبة تنفيذ البرامج. (ص (EA‏ 


فيما بعد في نفس التقرير, يذكر هذان المؤلفان: 
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نظرة dole‏ على نظرية الاستجابة للبند (IRT)‏ 


على الرغم من أن الأسطورة الشائعة أن نظرية القياس الكلاسيكية قد 
ماتت» إلا أننا نعتقد أن هناك العديد من السيناريوهات التي فيها يفضل 
استخدام نظرية القياس الكلاسيكية. معظم الأسباب التي يمكن تصنيفها 
تعود للقيود في البيانات التي قد تستبعد نظرية الاستجابة للبند والاعتبارات 
العملية التي قد تجعل نظرية القياس الكلاسيكية أكثر تفضيلًا. (ص +0( 


الطرق القائمة على نظرية الاختبار للبند IRT‏ ستستمر شعبيتها في الزيادة. وسيكون لها 
مزايا واضحة على الطرق السابقة في ظروف معينة. سوف تتعايش نظرية الاستجابة للبند 
والأساليب الكلاسيكيةء بقدر مشاركة تحليل الانحدار للمرحلة مع أساليب نمذجة المعادلات 
البنائية. على الرغم من أن SS‏ من نظرية الاستجابة للبند ونمذجة المعادلات البنائية حملتا 
أشياء أبعد من سوابقهماء إلا أن الطرق السابقة احتفظت بفائدتها. 


تمارين: 
-١‏ تمثل الأشكال التالية نتائج تحليل نظرية الاستجابة للبند لاثنين من البنود الافتراضية» 
ولكل منها خمسة خيارات استجابة. 





شكل (17-0): المنحنى المميز للبند (ICC)‏ الافتراضي ١‏ 
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شكل (1-0): المنحنى المميز للبند (ICC)‏ الافتراضي؟ 


١أ‏ - بناءً على تلك الأشكال البيانية» قم بتقيبم البنود فيما يتعلق Le‏ يلي واشرح ما هي 
خصائص المنحنى كأساس لتقريرك. 

١ب‏ - أي من البندين egis‏ بعمل أفضل في التقاط النطاق الكامل للظاهرة التي يقيّمها؟ 

١ج‏ - أي من خيارات الاستجابة على البند تؤدي وظيفة أفضل في التمييز بين المستويات 
ا مختلفة للظاهرة؟ 

-Y‏ صف الاختلاف ف المظهر للمنحنيات المميزة للبنود (ICCs)‏ لبندين ثنائيى الاستجابة 
binges items‏ مختلفين في معايير التمييز الخاصة بهما. l‏ 
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القياس في السياق البحثي الأوسع 


مهد الفصل الافتتاحي لهذا الكتاب المجال لما يجب متابعته من خلال تقديم بعض 
الأمثلة عن ومتى وماذا تبرز مشكلات القياس» ومناقشة دور النظرية في القياسء والتأكيد 
على الاقتصاد الخاطئ جراء العجلة في إجراءات القياس. وبشكل رئيسي» رسم الفصل 
الافتتاحي السياق البحثي الأوسع قبل أن ينتقل التركيز إلى القضايا المحددة التي تتناولها 
الفصول اللاحقة. هذا الفصل يعود إلى الصورة الكبيرة وينظر بإيجاز إلى المقياس ضمن 
السياق الأكبر للبحث. 


قبل تطوير المقياس: 


ابحث عن الأدوات الحالية: 

في بدايات هذا الكتاب» اقترحت أن تطوير المقياس Lia‏ غالبًا من نقص الأدوات 
الموجودة المناسبة. إن التأكد من عدم وجود بديل قياس مناسب مسبقاً يعتبر أمراً هاماً 
وفعالاً. bs‏ مكان آخر اقترح ديفيليس )1996 L3,b (DeVellis,‏ للبحث عن مقاييس 
مناسبة. بشكل أساميء تتضمن هذه العملية البحث في ملخصات منشورة وإلكترونية 
للمقاييس لتحديد ما إذا كان هناك مقياس مناسب موجود مسبقاً. وتحتوي السلاسل 
ا منشورة مثل الكتاب السنوي للقياسات الذهنية Mental Measurements Yearbook‏ 
(مثلاً سبيسء کارلسون» وجينسينجر 2010 (Spies, Carlson, & Geisinger,‏ واختبارات 
في الطباعة (Murphy, Spies, & Plake, 2006) Tests in Print‏ على مقاييس Dy pw‏ في 
المقام Jo!‏ ا في ذلك اختبارات القدرات والشخصية. be DE‏ تكون هذه هي الأدوات 
التي يستخدمها علماء النفس التطبيقيون لتقييم العملاء. الأدوات ال لمخصصة بشكل أساسي 
للبحث تكون UST‏ شهرة» ولكن يتم أخذ بعضها في الاعتبار. هناك فئة أخرى من المصادر هي 
المجموعات المستهدفة. Lio‏ المقاييس الكلاسيكية للشخصية Measures of Personality‏ 


تطوير المقاييس: النظرية والتطبيق Yev‏ 


الفصل الثامن 


ومقاييس المواقف النفسية الاجتماعية Social Psychological Attitudes‏ (روبينسون. 
شيفرء فيرجيتسمانء .(Robinson, Shaver, & Wrightsman,1991‏ كما أن ا مجلات ذات 
الصلة هي أيضًا مكان ممتاز للعثور على إستراتيجيات القياس التي حققت نجاحاً للآخرين 
ا مهتمين بنفس المفهوم GUI‏ محل الدراسة. 

مع التكرار المتزايدء يمكن للباحثين العثور على معلومات حول أدوات القياس على 
الإنترنت. في الواقع: قد يكون الإنترنت هو المكان الذي يظهر فيه التوسع السريع في ا معلومات 
المتعلقة بالقياس. وكمثال على التوسع في مصادر الإنترنت» أصبح كل من الكتاب السنوي 
للقياسات الذهنية (Spies et al.,2010)‏ والاختبارات ف الطباعة )2006 (Murphy et al.,‏ 
SLB‏ للبحث عبر الإنترنت في موقع الويب الخاص بمعهد بيروز Buros‏ للقياسات العقلية في 
جامعة نبراسكا في لينكولن Js .(/http://www.unl.edu/buros)‏ آخر بارز لمصدر من 
المصادر على الإنترنت للحصول على معلومات حول المقاييس» هو موقع الويب المتعلق بنظام 
معلومات قياس نتائج تقارير المرضى Patient-Reported Outcomes Measurement‏ 
Information System (PROMIS)‏ نظام معلومات القياس لنتائج تقارير المرضى 
5 هو مبادرة بحثية تدعمها المعاهد الوطنية للصحة كجزء من خارطة طريق 
البحث الطبي (انظر Ader,2007 «yo!‏ للحصول على نظرة (dole‏ لتحقيق ترتيب ووضوح 
أكبر لتقييم الحالات النهائية المهمة في البحوث الصحية )2010 .(PROMIS,‏ هذا الموقع 
هو بوابة للمعلومات التي تم تطويرها من خلال جهد تعاوني يضم جامعات متعددة 
وترعاه المعاهد الوطنية للصحة. قام محققو نظام PROMIS‏ بمراجعة وتقييم وتصنيف 
وتعديل وتطوير بنود تقييم النتائج الصحية في خمسة مجالات واسعة: الأداء Saul‏ الأداء 
الاجتماعيء الضيق العاطفيء الألمم» والإجهاد. ولقد خضعت هذه البنود للفحص الدقيق 
باستخدام طرق تستند إلى نظرية الاستجابة للبند IRT‏ البنود الموجودة في بنوك تلك 
ا مجالات المختلفة قد تمثل AST‏ البنود التي تمت دراستها بعناية. ومع استمرار جهود نظام 
PROMIS‏ ستخضع البنود للتحقق من الصحة على نطاق واسع ومن امحتمل إضافة 
مجموعات بنود جديدة. 

على الرغم من وجود استثناءات. مثل تلك المذكورة أعلاه» تميل مستودعات أدوات 
القياس LEW!‏ على الإنترنت والمستخدمة على نطاق واسع إلى أن تكون مؤقتة. إن متطلبات 
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التمويل والتوظيف والقضايا الإدارية الأخرى تعقد صيانة مثل هذه اممواقع» ونتيجة CU‏ 
لا يدوم الكثير منها لأكثر من بضع سنوات. ومع US‏ لا يزال الإنترنت مصدراً قيماً للباحثين 
الذين يسعون إلى oles!‏ المقاييس. تعد محركات البحث على الإنترنت أداة ممتازة لتحديد 
أدوات القياس التي تستهدف متغيرات معينة. بمعنى أن التطورات في خوارزميات البحث 
أدت إلى تقليل doled!‏ إلى ال مستودعات الموضوعة على المواقع. فإذا تم تطوير أداة لقياس 
متغير معين» فمن المرجح أن يجد البحث على الإنترنت Lol‏ الأداة نفسها أو معلومات حول 

كما هو الحال مع أي معلومات تستند إلى الإنترنت» يحتاج المستهلك إلى النظر في 
أصل المعلومات ومصداقيتها. فعادةً ما تقدم المواقع التي ترعاها الجامعات أو الهيئات 
الحكومية أو المؤسسات أو ال منظمات الأخرى المنشأة معلومات دقيقة وذات مصداقية. 
بشكل ale‏ ومع WS‏ هناك ما يبرر الحذر. مثلما توجد وفرة من كتب «العلوم التافهة» 
هناك أيضًا الكثير من مواقع الإنترنت التي قد تتبنّى أسلوب ومظهر الشرعية العلمية التي 
لا تتناسب مع محتواها. يجب أن تساعدك المهارات التي اكتسبتها من هذا الكتاب في 
تقييم مصادر معلومات القياس بشكل ناقد gbg‏ صيغة وتحديد ما إذا كانت المقاييس 
الموضحة قد أظهرت GLI‏ وصدقاً LES‏ ويعتبر ما إذا كان المقياس قد تم نشره في مجلة 
علمية محكمة آم له وسيلة أخرى لتقييم موثوقيتها. ddl‏ بالإضافة إلى اجتياز المقياس 
للتحكيم العلمي» لن يكون مفيدًا إلا إذا كان مناسبًا لتصور الباحث للمتغير محل الاهتمام. 
وبالتاليء هناك ما يبرر تمحيص مقياس معين بعد النشر في مجلة ما قبل تقرير أنه يعد 
اختيارًا [ue‏ مشروع بحث معين. l‏ 


عرض المفهوم البنائي في سياق المجتمع محل الاهتمام: 

غالبا ما يكون من المهم تقييم ما إذا كانت المفاهيم البنائية النظرية 
theoretical constructs‏ التي نحددها نحن الباحثين تتوافق مع التصورات والخبرات 
الفعلية للأشخاص الذين نخطط لدراستهم. يمكن أن تكون مجموعات التركيز (مثل 
(Krueger & Casey, 2000‏ والأساليب النوعية الأخرى (على سبيل المثالء دي والت» 
روسروك» Cog‏ ستون 2007 (DeWalt, Rothrock, Yount, & Stone,‏ وسيلة لتحديد ما 
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إذا كانت الأفكار التي تقوم عليها المفاهيم البنائية محل الاهتمام منطقية بالنسبة للمجيبين. 
كمثالء خذ بعين الاعتبار السمات - التفسيرات أو التأويلات التي ينسبها الأشخاص إلى نتائج 
مختلفة. غالبًا ما يتم تقييمها Gig‏ لأبعاد مثل ”تحت سيطرق“ مقابل ”ليس تحت سيطرق“ 
أو ”خاص بهذا الموقف“ مقابل ”ينطبق على معظم الحالات“ أو ”خاصيتي“ مقابل ”خاصية 
البيئة أو الموقف“. كانت البحوث في عمليات معالجة السمات مثمرة للغاية. حيث يمكن 
لمعظم الناس تحليل النتائج» مثل تلقي عرض عمل بعد ALLE)‏ على ضوء هذه الأبعاد. 
في بعض الحالات» قد لا يكون هذا هو الحال. على سبيل SEL!‏ إن مطالبة كبار السن من 
غير ال مولودين في المناطق الريفية والمقيمين في المناطق الريفية والذين يفتقرون إلى التعليم» 
والذين لا يعتادون على التفكير dig‏ هذه امصطلحات» بتقييم نتائج المرض أو قرارات 
الشراء وفقًا لهذه الأبعاد الثلاثة قد لا تعمل بشكل جيد حيث تشير التجربة إلى أنهم قد 
لا يفهمون المهمة ببساطة لأنها غريبة على طريقة تفكيرهم في الأشياء. إن مجموعة التركيز 
التي تطلب من المشاركين المحتملين في البحث مناقشة المفاهيم ذات الصلة قد تجعل هذه 
المشكلة واضحة وتمنع إستراتيجية القياس المحكوم عليها بالفشل. 

يمكن لمجموعات التركيز أيضًا أن تكشف عن اللغة الطبيعية اليومية التي يستخدمها 
الناس للحديث عن مفهوم ما. فقد لا تستخدم الأم الشابة نفس المصطلحات التي يستخدمها 
خبير التسويق لوصف ردود الفعل على المنتج. وقد تستخدم الأم الشابة «التظاهر» لوصف 
طفلها يلعب دون استخدام did‏ معينةء بينما قد يصف باحث تسويق مثل هذا الترويج 
بأنه guo»‏ غير موجه». بناء البنود Lg‏ يتناسب مع لغة الأم ا مستخدمة (على سبيل JELI‏ 
«كم مقدار الوقت من اللعب الذي يقضيه طفلك متظاهراً باللعب» دون استخدام أي 
ألعاب؟») بدلاً من استخدام لغة الأم الخبيرة (على سبيل المثالء «كم من الوقت يقضيه 
طفلك في اللعب غير ال موجه نحو المنتج؟») من المرجح أن ينتج أداة مناسبة لقياس تصوراتها 
لكيفية Jel‏ طفلها مع مختلف ال منتجات. 

المقابلات المعرفية هي وسيلة نوعية أخرى لتحديد كيفية تفسير المجيبين المحتملين 
للبنود وفهمها. على الرغم من وجود مجموعة متنوعة من الأساليب Ue)‏ سبيل JELI‏ 
(Willis, 2005 jabs‏ فإن الفكرة الأساسية هي التعلم من المجيبين عن طريق سؤالهم 
عما فهموه حول عنصر ما وكيف صاغوا استجابة له. ممكن أن تكشف هذه الطريقة غالبا 
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عن التشويش حول المفردات أو المفاهيم أو سوء الفهم المتعلق بخيارات الاستجابة التي 
قد يتجاهلها Coll‏ دون إجراء مقابلات معرفية. يوفر هذا الأسلوب ضمانًا إضافيًا Ob‏ 
الباحث وال مستجيب لديهم فهم مشترك لمعنى ogil‏ وبالتالي» هكن أن يعزز ذلك من 
صدق المقياس. 


وكملحوظة تحذيرية: يدعو بعض الباحثين إلى جعل المجتمع ال مستهدف يعطي الموافقة 
النهائية على الاستبيانات. هذا أمر مثير للإعجاب ومن المرجح أن يعطي المشاركين إحساسًا 
أكبر بالمشاركة الفعالة في عملية البحث؛ ومع US‏ من المهم التعرف على حدود خبرة 
المجيبين. قد يعرفون أفضل من الباحث كيف يتحدثون هم وأشخاص من خلفيات متشابهة 
حول قضايا مختلفة» وأنهم مؤهلون بشكل فريد لتقديم رؤى حول فهمهم ممحتويات 
الاستبيان. يمكن ممجموعات التركيز والمقابلات المعرفية الاستفادة من الخبرة التي يتمتع 
بها أفراد المجموعة اللمستهدفة Loud‏ يتعلق بهذه الأمور. لكنهم ليسوا خبراء في التفاصيل 
الفنية لبناء المقياس. ليس من العدل أن نتوقع من غير الخبراء أن يفهموا القضايا التي 
مت مناقشتها في الفصل الخامسء على سبيل SEM‏ لأنها تنطبق على ely‏ البنود. وكمثال 
على WS‏ قد يفضل شخص غير خبير بنداً تمت صياغته بطريقة جذابة ومعتدلة» في حين 
أن مطور المقياس ذا الخبرة قد يدرك أن هذه الصياغة ستولد تبايئًا بسيطًا في الاستجابات» 
مما يجعل البند غير ذي فائدة. توصيتي الشخصية هي: أن تكون Lalas‏ لاهتمامات 
ا مشاركينء وساعدهم على المشاركة بفعالية في مجموعة متنوعة من الطرق إذا كان ذلك 
مناسبًاء والاستفادة الكاملة من خبراتهم فيما يتعلق بالجوانب اللغوية أو الثقافية لصياغة 
البنود. واستمع إلى ملاحظاتهم بشأن المعنى من البنود للمجموعات GIS‏ الاهتمام» ولكن 
احتفظ بحق الموافقة النهائية على صياغة البند. نحن لا نكرم المشاركين في بحثنا إذا قمنا 
عن غير قصد بخلق موقف لا يمكن فيه قياس وجهات نظرهم أو مشاعرهم أو آرائهم 
بدقة؛ نحن ببساطة نضيع وقتهم. الهدف هو فهم ما هي طرق التعبير عن المفاهيم التي 
ستكون أكثر وضوحًا للمستجيبين مع الحفاظ على سلامة تلك المفاهيم. القيام بذلك يمكن 
أن يستفيد من فهم الرؤى الخاصة التي يقدمها المشاركون والباحثون والاستفادة من نقاط 
القوة في مجموعتي المشاركين والباحثين. 
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اتخاذ القرار بشأن طريقة تطبيق المقياس: 

يمكن للباحثين جمع البيانات بعدة طرق (مثل ديلمانء 2007 ‘Dillman,‏ 
فاولر 2009 (Fowler,‏ وقد يختارون طرق تطبيق المقياس Fly‏ على تفضيلات المجيبين. ووفقًا 
لذلكء قد يفكر فريق من الباحثين في استخدام طريقة المقابلة بدلاً من طريقة الاستبيان 
المطبوع. ومن المهم أن ندرك أن المقياس امراد إكماله في النموذج المطبوع قد يكون له 
خصائص مختلفة Éil‏ كير عند عرض البنود والردود شفهياً. على سبيل JEBI‏ قد يكون 
الآباء أكثر ترددًا في الاعتراف بالطموحات العالية إذا كان عليهم الإبلاغ عنها بصوت Jle‏ لمقابلة 
بدلاً من الاستبيان المطبوع. بشكل ple‏ من الحكمة pad‏ أسلوب تطبيق مقياس جديد على 
الطريقة المستخدمة أثناء تطوير امقياس. وكبديل UU‏ يجب على الباحثين فحص تأثير 
أسلوب تطبيق المقياس بشكل منتظم. ويمكن استخدام دراسة التعميم (انظر الفصل الثالث) 
لتحديد مدى إمكانية تعميم المقياس من خلال طرق تطبيق المقياس المختلفة. 


الأخذ في الاعتبار المقياس في سياق مقاييس أو إجراءات أخرى: 

ما هي الأسئلة أو إجراءات البحث التي ستسبق المقياس نفسه؟ كيف ستؤثر هذه 
الأسئلة على الإجابات على امقياس؟ يشير (Nunnally, 1978, pp. 627-677) JLigs‏ 
إلى عوامل سياقية Jis‏ أنماط الاستجابةء silly‏ والدافع كمتغيرات مؤثرة contingent‏ 
variables‏ ويشير Las)‏ إلى أنه يمكنها التأثير سلبًا على الأبحاث من خلال ثلاث طرق: )١(‏ 
عن طريق تقليل OLS‏ المقايبس؛ (Y)‏ من خلال تكوين مصادر موثوقة للتباين بخلاف 
المفهوم البنائي محل الاهتمام» وبالتالي تقليل الصدق؛ (Y)‏ عن طريق تغيير العلاقات بين 
ا متغيرات» وجعلها تبدىو على سبيل SU‏ أكثر ارتباطًا مما هي عليه بالفعل. كمثال على 
كيفية عمل المتغيرات SS‏ فكر في تحفيز المزاج والمجموعات المعرفية لأنها قد تنطبق 
على مثال أبحاث التسويق. قد يشكل تحفيز المزاج مشكلة إذا قرر الباحثون في التسويق» 
على سبيل Eb‏ تضمين مقياس الاكتئاب أو تقدير الذات في نفس الاستبيان كمقياس 
لتطلعاتهم. غالبًا ما تحتوي المقاييس التي تتطرق لهذه ا مفاهيم البنائية (وغيرها) على 
بنود تعبر عن آراء سلبية عن الذات. إن مقياس روزنبرغ Rosenberg‏ لتقدير الذات 
(Rosenberg, 1965)‏ على سبيل المثال. يحتوي على مثل هذه البنود السلبية مثل 
”أشعر أنه ليس لدي الكثير لأفتخر به“ (بالإضافة إلى بنود تعبر عن تقييم ذاتي إيجابي). 
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يمكن للباحث الذي م يكن Litas‏ للآثار المحتملة لاستقراء الحالة المزاجية أن يختار حصرياً 
سلسلة من البنود ذاتية النقد وضمها إلى مقياس تم تطويره حديتا. قد تؤدي قراءة العبارات 
التي تعبر باستمرار عن التقييمات السلبية لنفس الشخص إلى حدوث حالة خلل يمكن أن تتسبب 
بدورها في إدراك ما هو آت بشكل مختلف los‏ قد يحدث (على سبيل المثال كيهلستروم, chy!‏ 
ساندبراند» ووتوبايس 2000 ‘Kihlstrom, Eich, Sandbrand, & Tobias,‏ رهليسء ریسکندء 
لانء 1987 .(Rholes, Riskind,& Lane,‏ هذا قد يؤدي إلى كل من الآثار السلبية الثلاثة التي 
لاحظها -Nunnally (1978) «Jbg»‏ وهذا يعني أنه في حالة وجود بنود سلبية مؤثرةء قد 
تأخذ بنود الطموح درجة مختلفة من ا معنى» مما يقلل نسبة التباين في تلك البنود التي يمكن 
عزوها إلى المتغير الكامن المقصود. أوء في الحالة القصوى, قد تتأثر بعض البنود من مقياس 
الطموح بشكل أساسي بحالة الحالة المزاجية dis uch!‏ مما يجعل المقياس متعدد العوامل 
ويخفض صدقه كمقياس لطموح الوالدين. HS}‏ إلى المدى الذي يؤثر فيه مزاج المجيبين على 
استجاباتهم لبنود الطموح» قد ترتبط درجات هذا المقياس ارتباطًا مصطنعًا بالمقاييس الأخرى 
ols‏ الصلة بالمزاج. 


المجموعات المعرفية هي مثال أكثر عمومية لنفس الظاهرة. بمعنى أنه قد يتم تحفيز 
إطار مرجعي ما بخلاف ال مزاج من خلال تركيز انتباه المجيبين على موضوع محدد. على 
سبيل SLAM‏ قبل تطبيق مقياس الطموح مباشرة, فإن بنوداً تتعلق بدخل ا مستجيبين, 
وقيمة منازلهم» والمبالغ التي ينفقونها Goin‏ على GUS‏ مختلفة من السلع الاستهلاكية, 
قد تخلق حالة ذهنية تعمل على تغيير طموحاتهم تجاه أطفالهم „Dga‏ نتيجة لذلك قد 
تعكس الاستجابات للمقياس حالة عابرة غير مقصودة. كما هو الحال مع الحالة اممزاجيةء 
قد تؤثر هذه المجموعة المعرفية سلبًا على ثبات و/ أو صدق المقياس عن طريق تلويث 
المدى الذي يعكس فيه بشكل Y‏ لبس فيه طموحات الوالدين. 


بعد . لمي fy‏ قباس: 

تظهر مجموعة مختلفة تمامًا من القضايا بعد استخدام وتطبيق المقياس للعالجة سؤال 
بحثي موضوعي. وتبقى الاهتمامات الرئيسية في هذه dle pb}‏ هي تحليل وتفسير البيانات 
التي تم توليدها من خلال الأداة. 
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قضايا تحليلية: 

إحدى القضايا في تحليل البيانات هي مدى ملاءمة التقنيات المختلفة للمتغيرات ذات 
خصائص القياس المختلفة. لذا؛ فإن المنظور النظري والأساليب التي نوصي بها بقوة 
في هذا الكتاب يجب أن ينتج عنها مقاييس قابلة لمجموعة واسعة من طرق تحليل 
البيانات. على الرغم من il‏ با معنى الحرفي للكلمة» البنود التي تستخدم صيغ ليكرت 
Likert‏ أو الاستجابة التفاضلية الدلالية semantic differential response‏ قد تكون 
رتبية» إلا أن الخبرة الثرية المتراكمة تدعم تطبيق الأساليب التحليلية المستندة إلى القياس 
الفتري interval-based analytic methods‏ على المقاييس التي تنتجها. ومع US‏ فإن 
السؤال كان حول ما هي الأساليب الأنسب لنوع البيانات» وبالتأكيد سوف يستمرء في 
نقاش ساخن في العلوم الاجتماعية. ويعد تحديد LAS‏ تأثير خيارات الاستجابة المختلفة 
على تقديرات المتغيرات الأساسية مجالًا نشطًا للبحث في حد ذاته. daj‏ سيكون لدى 
مختلف الجماهير توقعات مختلفة لكيفية التعامل مع المقاييس. وفي حين أن علماء 
النفس» على سبيل JEL‏ قد يكونون متفائلين إلى حد ما في التعامل مع قياسات ليكرت 
على أنها تنتج بيانات على المستوى الفتريء O‏ علماء الأوبئة قد لا يكونون كذلك. رها 
يكون النهج الأكثر عملية هو ASAI‏ (والتوافق) مع التوجه السائد فيما يتعلق بهذه 
القضية في مجال اهتمام الفرد. 


LLAS‏ التفسير: 
على افتراض أن الباحث قد توصل إلى خطة تحليلية مناسبة للبيانات التي تم إنشاؤها 
بواسطة مقياس تم تطويره Bue‏ فإن مسألة كيفية تفسير البيانات لا تزال قاثمة. إحدى 
النقاط التي يجب وضعها في الاعتبار عند هذا المنعطف هي أن صدق المقياس م يتم 
تأسيسه بشكل قاطع أثناء تطوير المقياس. التحقق من الصدق عملية تراكمية مستمرة. 
علاوة على US‏ فإن صدق المقياس هو في الحقيقة إحدى خصائص كيفية استخدام lhl‏ 
وليس المقياس نفسه. مقياس الاكتئاب» على سبيل SEL!‏ قد يكون Bolo‏ لتقييم الاكتئاب 

ولكن ليس لتقييم التأثير السلبي العام. 
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Las]‏ من المهم التفكير في النتائج التي تم الحصول عليها. خاصة إذا كانت النتائج تبدو 
غير بديهية أو مضادة للنظريةء فيجب على الباحث عندئذ أن يفكر في احتمال أن يكون 
المقياس غير Gobo‏ في سياق تلك الدراسة بالذات (إن لثمم يكن على نطاق أوسع). قد يكون 
مدى صدق المقياس الذي يمكن أن يعمم على المجتمعات أو الأطر أو التفاصيل المحددة 
لتطبيق المقياس أو مجموعة متنوعة من الأبعاد الأخرى محدوداً. على سبيل SUL!‏ مقياس 
طموح الوالدين الافتراضي ربما يكون قد تم تطويره مع وجود مجموعة غنية نسبياً في 
الاعتبارء وقد يكون من غير المقبول صلاحيته للأفراد الذين تكون مواردهم محدودة. يجب 
أن تأخذ أي استنتاجات تستند إلى مقياس محدود الاستخدام بعين الاعتبار ما يلي: (أ) كيف 
يختلف تطبيقه الحالي عن سياق الصلاحية الأصلي الخاص dy‏ (ب) احتمال أن تؤدي هذه 
الاختلافات إلى الحد من Gro‏ المقياسء و(ج) آثار تلك القيود على البحث الحالي. 


قابلية التعميم: 

تم التحذير في الفقرة السابقة من التعميم على المجتمعات والأطر والجوانب الأخرى 
للبحث. هذه القضية تستدعي المزيد من التركيز؛ فالتوصل إلى استنتاجات حول الفروق بين 
المجموعات قد يتداخل مع الاختلافات في الظاهرة التي يتم قياسها والاختلافات في أداء الأداة. 
إذا استطعنا أن نفترض أن الأخير asl)‏ الاختلافات في الظاهرة التي يتم قياسها والاختلافات 
في أداء الأداة) طفيفء فيمكننا أن نسند الفروق ال ملحوظة إلى عضوية المجموعة. في العديد 
من المواقف (على سبيل JELI‏ مقارنة وقت الانتهاء من المهمة في مجموعتين من الأطفال 
الذين تم اختيارهم وتخصيصهم بشكل Glo ds‏ للمجموعتين)» ستكون هذه هي الحالة. 
في مجموعات أخرى Ue)‏ سبيل SEL!‏ المقارنات بين المجموعات الممتمايزة (SUBS‏ لا يمكننا 
افتراض clo}‏ متطابق للأداة. يعد أداء البند differential item functioning Joli!‏ 
الذي تمت مناقشته باختصار في الفصل lull‏ مجالًا نشطًا للبحث السيكومتري. وعلى 
الرغم من أن معظم الباحثين لن يجعلوا من تلك القضايا محورًا لجهودهم الخاصة. إلا أنه 
ينبغي عليهم إدراك إمكانية وجودها والقيود التي قد تفرضها على استنتاجاتهم. 
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أفكار ختامية: 


القياس الصغير والقياس الكبير: 

الجانب الأخير من القياس الذي يستدعي النظر هو نطاق المهمة وتعقيد الأدوات 
اللازمة لها. في مكان آخر من هذا الكتاب (على سبيل اممثال» في مناقشة صدق المحتوى)» 
تحدثت عن مدى اتساع المفهوم البنائي construct‏ الذي صممت الأداة لتقييمه. وأود 
العودة هنا إلى موضوع ذي صلة من خلال النظر في كيفية ارتباط نطاق سياق القياس 
بتعقيد مجمل جهد القياس. هنا سأبداً بتشبيه أو محاكاة. 


الزوارق والسفن البحرية: 

عندما كنت طالب دراسات علياء أمضيت فترة ما بعد الظهر في مساعدة صديق كان 
يبني زورقاً من مجموعة أدوات اشتراها عبر البريد. لقد كانت هذه مهمة مجدية اقتصاديًا 
وتكنولوجيًا لشخص ajil‏ بكل النفقات المعتادة والمتطلبات الزمنية لحضور برنامج 
الدراسات العلياء وقد خدم هذا الزورق صديقي وعائلته I‏ لسنوات عديدة. لو كان 
قد اقترح عليّ أن أمد له يد العون باستخدام بعض الأموال التي يمكن ادخارها لبناء سفينة 
dy you‏ لربما أحلته إلى مرفق الصحة العقلية بالحرم الجامعي. لكنه 6 يكن في حاجة إلى 
سفينة بحرية لأنواع رحلات المياه التي تَصوّرّها وتمتع بها في نهاية المطاف. كان الزورق 
Gulag has‏ للاستخدامات التي قصدها. 

الزوارق والسفن البحرية على حد slow‏ مراكب dais‏ على الرغم من اختلافها الواضح. 
Ley‏ يكون الاختلافان الأكثر وضوحًا login‏ حجمهما ووظيفتهما. الزوارق SLE‏ عن قوارب 
صغيرة IS‏ قدرة عالية على المناورة مثالية للاستخدام في المياه المغلقة نسبيًا من قبل 
شخصين أو ثلاثة. إذا كنت ترغب في استكشاف نهر لطيف» واستغراق بعض الوقت لدخول 
مختلف الخلجان الصغيرة وفحص اللواطن الطبيعية بشيء من التفصيلء فإن الزورق crab!‏ 
جيدا والمصمم بعناية يعد وسيلة مناسبة للغاية. 

سفن الرحلات البحرية هي سفن كبيرة جدًا قادرة على استيعاب آلاف الركاب وتزويدهم 
بمجموعة من وسائل الراحة والأنشطة أثناء عبور البحار المفتوحة. لقد تمت مقارنتها با مدن 
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العائمة فيما يتعلق بمجموعة الخدمات وامرافق التي تقدمها. وتشمل هذه Bole‏ قاعات 
للاحتفالات» ومرافق ikli aleb‏ وأماكن إقامة dou yo‏ للنوم» وخدمات متخصصة يقدمها 
فريق كبير من الموظفين. تعتبر سفينة الرحلات البحرية أكثر من dug‏ مواصلات» فهي 
تؤدي وظائف متعددة. مثل الترفيه والإقامة» ويمكنها تقديم هذه الوظائف بشكل جيد على 
قدم الممساواة في أجزاء مختلفة من العام. الحجم والوظيفة ليستا الاختلافات الوحيدة بين 
هذين النوعين من القوارب المائية. تشغيل كل نوع يتطلب مستويات مختلفة من الخبرة. 
فمعظم البالغين الأصحاء (والكثير من الأطفال) الذين لديهم بعض الإرشادات والخبرات 
القصيرة نسبيًا مكنهم تجربة الزورق. من ناحية )5 og‏ تتطلب سفينة الرحلات البحرية 
طاقمًا مدربًا ومعتمدًا من المهنيين البحريين لتشغيلها بأمان. هثل الوقت اللازم لتصميم 
الزورق وبناءه وتشغيله مجرد جزء بسيط من النطاق الزمني ylän‏ بجلب سفينة سياحية 
للخدمة. النماذج التي تتخذها الزوارق وسفن الرحلات البحرية يتم استنباطها من خلال 
قواعد المعرفة المختلفة» مع توازن مختلف تماماً بين الخبرة والتكنولوجيا المتقدمة التي 
تميزها. رما بسبب بساطتها النسبية» كانت الزوارق بأشكال مختلفة مستخدمة منذ آلاف 
السنين. Why‏ لدينا ثروة من المعرفة العملية عنهم Gilly‏ هكن أن تساعدنا على فهم 
blä‏ القوة والضعف في بدائل التصميم المختلفة. باممقابلء تتمتع سفن الرحلات البحرية 
بتاريخ أقصر بكثير ولكنها تستفيد من التطورات التكنولوجية في التصميم والتصنيع. Aol‏ 
في حين أن تكلفة الزورق متواضعة Lud‏ فإن تكلفة تصميم وبناء وتجهيز وتزويد سفينة 
الرحلات البحرية أكبر بعدة مرات. 


تقوم كل من الزوارق وسفن الرحلات البحرية بعملها بشكل جيد. تعد الزوارق هي 
الأفضل في حالة الرحلات القصيرة» رغم أنه lad‏ مضى من الزمن» تم إكمال رحلات ممسافات 
طويلة بنجاح باستخدام الزوارق. ما نسميه الآن جزر هاوايء على سبيل JELI‏ من ا محتمل 
أنه تم استعمارها Alay‏ من قبل المسافرين من أجزاء أخرى من بولينيزيا حيث كانوا 
يسافرون مسافات طويلة عبر الزوارق. ومع WS‏ يفضل معظمنا اليوم عبور oll‏ المفتوحة 
لجنوب المحيط الهادئ على متن سفينة سياحية. مع الرفاه والراحة والسلامة التي توفرها. 
على الرغم من أن الزورق كان بإمكانه (ويفترض أن يفعل) إنجاز oghl‏ إلا أن سفينة أكثر 
تطوراً وقدرة تبدو أكثر ملاءمة للوظيفة, والرحلات عبر بولينيزيا في هذه الأيام من المرجح 
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أن تكون باستخدام سفن الرحلات البحرية أكثر من الزوارق. من ناحية أخرىء بمجرد 
وصول سفينة الرحلات البحرية إلى هاواي من أرخبيل بولينيزي آخرء قد يتنقل المسافر 
من سفينة الرحلات ويستخدم مركبة أصغر بكثيرء مثل الزورق أو قوارب الكاياك. للقيام 
ببعض الاستكشافات عن قرب في الجزر والممرات ASU‏ الأصغر. لا يمكن ببساطة لسفينة 
الرحلات الكبيرة المرهقة أن تعمل كزورق عندما يتم تضييق مقاس الممر GU‏ أضف إلى 
ذلك أنه هكن بسهولة نشر قوارب متعددة لاستكشاف مناطق مختلفة على طول ساحل 
متعرج أو مجرى Glo‏ دائري. 

لذلك أيهما Ladi‏ سفينة رحلات سياحية أم زورق؟ أود أن أقترح أن لكل منهما مكانه 
وغرضه» وعلى الرغم من أن وظائفهما تتداخل إلى حد cle‏ فمن الواضح أن هناك مواقف 
يفضل أحدهما على الآخر. من المؤكد أن الحصول على الزورق أقل تكلفة» ولكن على الرغم 
من الرحلات البطولية للزوارق التي استكملت في العصور القديمة» فمن المحتمل أن تكون 
مقصورة على مهام بسيطة. من ناحية أخرىء فإن التكلفةء والخبرة التكنولوجيةء والوقت» 
والجهد العام الذي ينطوي عليه بناء سفينة سياحية. يحول دون استخدامها في نزهات مائية 
أكثر تقييدًا تكون فيها مركبة أصغر حجمًا كافية تمامًا. 


القياس «الزوارق» والقياس «سفن الرحلات البحرية»: 

بشكل ele‏ يمكن للمرء أن يقارن بين «القياس الصغير» و«القياس الكبير» ورسم بعض 
امقارنات لمناقشتنا للقوارب المائية. ما أشير إليه على أنه قياس صغير ينطوي على تصور 
وتطوير وتقييم المقايبس التي Sole‏ ما تكون أكثر 5.55 وتحديداً. الأمثلة النموذجية 
هي الحالات العديدة التي يسعى فيها الباحث للإجابة. ضمن مسعى بحثي مقيد. على 
أسئلة محددة حول بعض المتغيرات التي لا تتوفر لها مقاييس مناسبة. في هذه الحالة 
يكرس الكثير من الباحثين الجهود لإنشاء المقايبس التي تتطلبها أبحاثهم. على الرغم من 
أن الظروف ستختلف بوضوح من مثال إلى مثال للقياس الصغير. OLS‏ الباحث في كثير 
من الأحيان يتحكم بشكل كبير في LAS‏ تشغيل البناء على نطاق واسع أو ضيق. يمكن 
تصميم العناصر التي تم تطويرها لالتقاط البنية بشكل متكرر لاستهداف المتغير الكامن 
للاهتمام بدقة كبيرة ولتلبية بعض الافتراضات التي يمكن أن تبسط عملية التطوير والتحقق. 
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هتد التطوير الأولي في كثير من الأحيان لعدة أشهر وليس لعدة سنوات» كما أن الموارد 
اللازمة والمهام التي ينطوي عليها هذا الجهد يمكن التحكم فيها نسبيًا. القياس الصغيرء في 
هذا otal‏ يشبه الزورق في التشبيه السابق. وهذا يعني أن حجم المشروع بسيط Guus‏ 
وستكون وظيفة الأداة المطورة Éa‏ محددة GLE‏ ومستوى الخبرة اللازمة لتصميم الأداة 
في متناول أيدي العديد من الباحثين الأكفاء. والوقت ا مطلوب في متناول اليد والإجراء هكن 
أن يستفيد من الخبرة العملية بدلاً من الاعتماد على أحدث التطورات» والتكلفة الإجمالية 
ليست باهظة. 


أعني بالقياس الكبير» العمل الذي يهدف إلى تقييم مفاهيم واسعة» ومتعددة الجوانب 
بطرق تهدف إلى تقديم نتائج ومجموع ات أدوات ALE‏ للتعميم إلى حد كبير ويمكن 
استخدامها على نطاق واسع عبر مجموعة من الظروف المتنوعة والتي يحتمل أن تكون 
صعبة. بالإضافة إلى كون المفاهيم نفسها واسعة. فإن مستوى الخبرة المطلوبة لتحقيق 
قياس كبير حقاً هو في الغالب أمر جوهري. وغالبًا ما تظهر للعيان مثل هذه الأنشطة خلال 
إطار زمني ممتد» وقد يعتمد تصميم الأدوات بشكل كبير على التطورات المتقدمة في نظرية 
القياس والممارسة أكثر من الخبرة العملية مع الأساليب dy ob!‏ والحقيقية. نتيجة لهذه 
المطالب المختلفة, Old‏ التكلفة الإجمالية للقياس الكبير dole‏ ما تكون كبيرة. 


تشمل الأمثلة على القياس الكبير الاختبارات التعليمية الموحدة مثل اختبار القدرات 
الدراسية (SAT)‏ واختبارات الخريجين القياسية (GRE)‏ أو مشاريع التقييم الصحي الشاملة 
مثل مبادرة PROMIS‏ في هذه الحالات» المتغيرات التي يتم قياسها معقدة وتتضمن 
مجموعة من المفاهيم الأكثر تحديدًا.. تشمل القدرات الدراسية: على سبيل SEL‏ سمات 
أكثر Gus‏ مثل فهم القراءة والمفردات والكفاءات الرياضية. وبامثل مبادرة PROMIS‏ 
واسعة النطاق. تضع مقاييس لمجموعة متنوعة من النتائج المتعلقة بالصحة تتراوح من 
الاكتناب إلى المشاركة الاجتماعية إلى قيود التنقل. هذه الأمثلة هي أيضًا هرمية حيث 
تحدد متغيرات محددة أكثر (مثل المهارات النحوية أو قيود التنقل) كجزء من المفاهيم 
الأوسع (على سبيل JEL‏ الاستعداد اللفظي أو الأداء البدني). التقييمات الشاملة للمفاهيم 
الواسعة Jio‏ هذه النتائج الأكادهية والصحية تعتبر أنشطة كثيفة الاستخدام lgd‏ 
وعادةً ما تشمل سنوات عديدة من الجهد وفرق البحث الكبيرة ذات المهارات العالية. 
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وكمثال على الخبرة ا لمتخصصة اللازمة للجهود المبذولة في هذا Sleek!‏ عندما بدأت مبادرة 
۴۴5 كانت تتكون من مراكز Cou‏ متعددة تتبع جوانب مختلفة من نطاق النتائج 
الصحية الأكبر. يضمن كل فريق من هذه الفرق واحدًا أو أكثر من امهنيين ذوي الخبرة 
الكبيرة في القياس. ومع تقدم العمل» واجه باحثو مبادرة PROMIS‏ صعوبات شكلت تحدياً 
للخبرات المتاحة للفرق الأساسية» وسعى البرنامج إلى الحصول على مدخلات إضافية من خبراء 
أكثر خبرة وتخصصًا. مع استمرار العمل إلى أبعد من ذلكء استعان الكادر الأصلي من الخبراء 
الخارجيين بآراء علماء القياس النفسيين الأكثر خبرة وتخصصًا. مشاريع القياس الكبيرة مثل 
9 أو dlo PROMIS‏ لسفن الرحلات البحرية متعددة الوظائف التي وصفتها ÓL‏ 

على الرغم من أن أهداف ومتطلبات القياس الصغير Sole‏ ما تكون أقل من تلك اللازمة 
للقياس الكبير» فإن الكلمات الوصفية ”الكبيرة“ و”الصغرة“ لا تهدف إلى الإشارة إلى الاختلافات 
ذات الأهمية أو القيمة العلمية. في eile!‏ العديد من مشاريع القياس الكبيرة مستوحاة 
من جهود القياس الصغيرة السابقة GL)‏ كما قد تتبعت سفن الرحلات البحرية اليوم الطرق 
التي كانت تعبرها الزوارق التي تعود إلى عصور ما قبل التاريخ). يمكن لمقاييس محددة ذات 
سمات مهمة أن تفرز برامج بحثية عالية الإنتاجية. وف بعض الحالات» سيتم توسيع نطاقهاء 
وقد تنتقل نماذج القياس المستخدمة من قياس صغير إلى كبير. في حالات أخرى, ستبقى 
المتغيرات المحددة للغاية محور اهتمام مهم دون أن تصبح أوسع أو تستدعي الانتقال إلى 
محاولات قياس أكثر تفصيلاً أو واسعة. 


الآثار العملية للقياس الصغير مقابل القياس الكبير: 

ghb ما تكون النماذج والأدوات التحليلية اللازمة للقياس الصغير أكثر بساطة.‎ LIE 
يعتمد النموذج «الصحيح» والأسلوب التحليلي «الصحيح» بشكل أساسي على طبيعة أسئلة‎ 
البحثء ولكن مع القياس الصغيرء قد يكون الأمر أكثر ملاءمة لتصميم بنود تلبي افتراضات‎ 
النماذج الأكثر بساطة والتي تتطلب الأساليب التحليلية الأقل تعقيداً. على سبيل ا مثالء في‎ 
اقترحثٌ معايرة صياغة البند‎ Likert scale الفصل الخامس» عند مناقشة بنود مقياس ليكرت‎ 
من خلال تخيل كيف يمكن للمستجيب العادي أن يجيب على كل مجموعة من البنود قيد‎ 
الدراسة. وأوصيث أيضًا بتصميم البنود بحيث يحتمل أن يختار معظم المشاركين استجابة‎ 
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بالقرب من منتصف نطاق خيارات الاستجابة المتاحة لهم. هذا يؤدي أساسًا إلى السعي 
للحصول على بنود ذات مؤشرات حساسة بنفس القدر لقوة مستوى كل مستجيب للمتغير 
الأساسي. والنتيجة الشائعة لهذه الخطوة البسيطة إلى حد ما هي أنها تميل إلى إنتاج بنود SIS‏ 
تباينات وتشبعات loadings‏ على العامل ال مشترك كبيرة نسبيًا ومتجانسة إلى حد ما. وهذا 
يعني أن البنود تميل إلى التوافق بشكل أكبر مع افتراضات مكافئ «تاو» tau equivalence‏ 
الأساسية. إذا كان الدليل التجريبي يكشف أن التباينات والتشبعات» في الواقع» متجانسة إلى 
حد ما وأن البنود قد تم إنشاؤها بشكل صريح مع الأخذ في الاعتبار جعلها وبشكل متساو 
مؤشرات جيدة للمتغير الأساسي, فإن الأساليب القائمة على مبدأ مكافئ equivalency «gb»‏ 
tau‏ الأماسي (مثل معامل (WÍ‏ قد تكون مناسبة. (دليلٌ آخر على أن نموذج مكافى تاو 
tau-equivalent, gulu]‏ قد يناسب البيانات» هو إنشاء معامل Lill‏ المحسوب باستخدام 
إما التباين المشترك أو الصيغ القائمة على الارتباطء تعطي B‏ متشابهة Las) (Ae‏ محاولة 
كتابة بنود بحيث أن المستجيب العادي من المرجح أن يختار خيار استجابة بالقرب من مركز 
النطاق المتاح لخيارات الاستجابة Gow‏ ميل إلى تقليل الالتواء skewness‏ في البيانات. وكما 
كشفت مناقشة قيود alpha Wi‏ في الفصل الثالث. فإن تجنب الالتواء في البيانات سوف 
يخفف من المشاكل المحتملة جراء استخدام ألفا عندما تكون خيارات الاستجابة فعليًا ليست 
من القياس الفتري bbg interval scaled‏ يمكن التبرير بسهولة بإعطاء أوزان متساوية 
للبنود عندما تكون التباينات والتشبعات متجانسة Gus‏ بحيث يمكن g garb‏ أو متوسط 
درجات البنود أن يخدم ببساطة كملخص للمقياس ككل. 

إن التحكم الأكبر الذي يتمتع به الباحث عادةً في حالات القياس الصغير هو أن القياس 
الأصغر يتيح للباحث أساليب أبسط من الناحية المفاهيمية والتحليلية. قد يكون مفيدًا 
أيضًاء باستخدام نفس البيانات» لمقارنة النتائج بين الأساليب التقليدية As)‏ سبيل JELI‏ 
حساب معامل ألفا استنادًا إلى ارتباطات بيرسون القياسية) والأساليب المطورة التي تستند 
إلى افتراضات أكثر ليبرالية (على سبيل JEL‏ حساب أوميغا كتقدير للثبات (reliability‏ إن 
المقارنات من هذا cg gil‏ باستخدام البيانات الحقيقية الناتجة من البنود التي تم إنشاؤها مع 
إدراك افتراضات النموذج الذي صممت البنود لتحقيقه» لا تزال نادرة نسبيًا وستقدم خدمة 
كبيرة مجتمع البحث. 
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الأفكار التي نوقشت هنا تتعلق في المقام الأول بثبات أداة القياس» وبطبيعة الحالء 
OLS‏ مدى OLS‏ المقياس يفرض قيودًا على صدقه validity‏ ومع US‏ كما هو مذكور في 
الفصل الرابع» OX‏ أن يؤثر ”التوسع الكبير“ في بنود المقياس على الصدق بشكل مباشر 
(على سبيل JEL‏ من خلال جعل كل أو بعض محتوى بنود المقياس غير صالح في سياقات 
معينة). Labs‏ فإن نطاق جهد القياس ال مخطط مهم في مراحل متعددة من تطوير 
المقياس ويستحق النظر فيه بعناية. 

إذا كانت البيانات أو أسئلة البحث لا تبرر الأساليب الأبسط لتطوير المقياس» فيجب على 
الباحث استخدام كل ما هو ضروري لتقديم الأسباب الأوضح والأكثر دقة لعملية القياس 
والأداة الناتجة. في بعض الحالات» قد يتطلب ذلك البحث عن مشاركة أو مساهمة من 
متخصصي القياس الأكثر خبرة. لمجرد أن المحيطات كانت قد عبرت بالزوارق لا يعني أن 
القيام بذلك في وقتنا الحالي» عندما توجد سفن أكثر قوة, أمر جيد. ولكن على نفس اممنوالء 
إذا أمكن تبسيط العملية ها يحقق الأهداف البحثية ا لمقصودة بالقدر الكاف» فإنه يمكن أن 
تكون البساطة الناتجة ذات فائدة كبيرة. بالإضافة إلى US‏ الجهود والموارد غير الضرورية 
التي لا تفيد مرحلة القياس قد يتم تحويلها لصالح بعض الجوانب الأخرى للمشروع. وعلى 
الرغم من وجود قيمة في فهم كيفية توظيف نماذج القياس والأساليب التحليلية الأكثر 
تعقيدًاء إلا أن هناك قيمة مكافئة في إدراك - ويفضل أن يكون ذلك في مرحلة مبكرة من 
العمل - أن توظيفها غير ضروري > لتحقيق الهدف المطروح. LIE‏ ما يوفر القياس 
الصغير Jib LO,‏ هذا التبسيط الذي Hob‏ ما يحدث في القياس الكبير. 


تذكّرء القياس مسألة هامة: 


القياس يمثل جانباً حيوياً في البحوث الاجتماعية والسلوكية. بغض النظر عن مدى جودة 
تصميم وتنفيذ جوانب أخرى من المسعى البحثي» هكن للقياس بناء أو هدم الدراسة. 
نفترض أن المتغيرات التي تهمنا تتوافق مع إجراءات التقييم التي نستخدمها. في كثير من 
الأحيانء العلاقة محل الاهتمام الرئيسي تكون بين اثنين أو أكثر من المتغيرات التي لا هكن 
ملاحظتها أو رصدهاء مثل الرغبة في الحصول على نتيجة معينة والفشل في التفكير في نتائج 
بديلة. لا يمكننا قياس الرغبة أو الاعتبار مباشرةء WI‏ نبني مقاييس نأمل أن تتضمنها. 


0 تطوير المقاييس: النظرية والتطبيق 


القياس في السياق البحثي الأوسع 


هذه اممقاييس» هي إلى حد cle‏ استعارات كمية للمفاهيم الأساسية. فقط إلى الحد الذي 
تكون فيه هذه الاستعارات ملائمة gl)‏ الأدوات صالحة). فإن العلاقات التي نلاحظها بين 
المقاييس تعكس العلاقة التي نرغب في تقييمها بين المفاهيم البنائية غير القابلة للملاحظة 
أو الرصد. أخذ العينات الممثلة,. وتصميم البحث المميزء والتنفيذ المتقن للإجراءات لن يغير 
هذه الحقيقة. الباحث الذي لا يفهم العلاقة بين المقاييس والمتغيرات التي تمثلهاء با معنى 
الحرفيء لا يعرف ما الذي يتحدث عنه. إذا نظرنا إليها في ضوء OLS WS‏ الجهود التي 
ينطوي Yale‏ القياس الدقيق تتم مكافأتها بشكل واف من خلال فوائدها. 


تمارين: 
-١‏ صف بإيجاز القياس الصغير والقياس الكبيرء واذكر مزايا وعيوب كل منهماء وقدم أمثلة 
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-١‏ د. سعد بن سعيد القحطانى 
المؤهلات العلمية: 
حاصل على درجة الدكتوراه 3 الإحصاء التطبيقي ey els‏ من جامعة كولورادو 
بالولايات المتحدة الأمريكية. 
الوظيفة الحالية: 
مدير مشروع قياس الإنتاجية وأمين المجلس العلمي بمعهد الإدارة العامة. 

أهم الخبرات العلمية والعملية: 

- مدير سابق لقطاع الإحصاء وإدارة الدعم المنهجي والإحصائي با معهد. 

- مستشار Glas!‏ غير متفرغ لعدد من الأجهزة الحكومية. 
الأمريكية طمدة ثلاث سنوات. 

- تحكيم عدد كبير من البحوث والدراسات العلمية والاستبانات. 

- شارك في رئاسة وعضوية العديد من اللجان العلمية والاستشارية داخل وخارج المعهد. 

- تقديم العديد من المحاضرات والدورات التدريبية والحلقات التطبيقية وورش العمل 
واللقاءات العلمية والمشاركات الإعلامية داخل وخارج معهد الإدارة العامة في مجال 
الإحصاء وتحليل البيانات وتصميم الاستبانات ومؤشرات الأداء. 

- تأليف وترجمة عدد من الكتب والحقائب التدريبية والتي من أهمها كتاب مؤلف في الإحصاء 
التطبيقي )10 (aY:‏ وآخر مترجم في نمذجة المعادلات البنائية (/582)باستخدام أموس. 

- نال جائزة عميد الدراسات العليا للتفوق الأكادمي في مرحلة الدكتوراهء الميدالية الذهبية 
كجائزة لأفضل أطروحة دكتوراه على مستوى الجامعةء جائزة أفضل مدرب في معهد 
الإدارة العامة لعام 1م 
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-Y‏ أ.د. طارق عطية عبدالرحمن 
المؤهلات العلمية: 
دكتوراه في ole‏ الاجتماع الريفي من AS drole‏ الشيخ- PYV c pas‏ 
الوظيفة الحالية: 
أستاذ دكتور في ale‏ الاجتماع الريفي بجامعة كفر الشيخ. مصر؛ وعضو هيئة تدريب 
بمركز البحوث والدراسات بمعهد الإدارة العامةء الرياض. 
أهم الخبرات العلمية والعملية: 
- كتابة ونشر أكثر من (EY)‏ عملاً علمياً شرت في مجلات drole‏ محكمة Ables du se‏ 
.(indexed scoups journals)‏ 
تأليف ous‏ من الكتب العلمية المحكمة في مجالات علم الاجتماع الريفي» ورأس JU!‏ الاجتماعي 
والفعالية التنظيمية» وإدارة المعرفة والإبداع التنظيميء وأساليب ومناهج البحث العلمي. 
- ترجمة OLS‏ في أساسيات اختيار أساليب المعاينة. 


- تقديم العديد من المحاضرات والدورات التدريبية والحلقات التطبيقية وورش العمل واللقاءات 
العلمية والاستشارات في مجال منهجية البحث العلمي والإحصاء الاجتماعي وتحليل البيانات. 

- تأليف وتصميم ومراجعة عدد من الحقائب التدريبية والبرامج التدريبية والملفات العلمية. 

- المشاركة في ous‏ من المشروعات البحثية كباحث رئيس (PI)‏ أو باحث مشارك (COD)‏ في 
sus‏ من الجهات البحثية. l‏ 

- عمل عضواً في لجنة البحوث العلمية بمعهد الإدارة العامة بالرياض. 

- عمل عضواً في هيئة تحرير مجلة "الإدارة العامة". 

- محكّم معتمد لدى sus‏ من الجهات البحثية وال مجلات العلمية. 

- الإشراف على sue‏ من طلاب الدراسات العليا لدرجتي الماجستير والدكتوراه بجامعة DAS‏ 
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مراجع الترجمة في سطور 

أ.د. عبدالرحمن بن سليمان العنقرى 
المؤهلات العلمية: 

دكتوراه ف الإحصاء التطبيقي» تخصص إحصاء لامعلمي, جامعة جلاسجوء امملكة 
NAV touch!‏ 
الوظيفة الحالية: 
أهم الخبرات العلمية والعملية: 
- مستشار متفرغ GH‏ وزارة التعليم العالي من عام aV EYT‏ حتى OYI‏ 
- مستشار glas)‏ لفريق الخطة الوطنية لتقنية ا معلومات من عام VEVE‏ حتى NEYE‏ 
Gob -‏ زائر » كلية العلوم» الجامعة الإسلامية في ماليزياء ماليزياء 575-1١51531‏ اه 
- رئيس قسم الإحصاء وبحوث العمليات. كلية العلوم, جامعة ال ملك DEVY -VEVA dgw‏ 
- رئيس الجمعية السعودية للعلوم الرياضية. drole‏ الملك سعود. 5179-١610‏ اه 


الاستبانة الإحصائيةء 61١/‏ اه 


- متعاون مع المؤسسة العامة للتدريب التقني والمهني لتدريس مقرر الاحتمالات والإحصاء 
الهندسي بالكلية التقنية DENA Gob Jb‏ 

- مناقشة عدد من رسائل الدكتوراه والماجستير بجامعة ال ملك سعود وجامعة الأميرة نورة 
بنت عبد الرحمن. 

- الإشراف المباشر على نظام إحصاءات التعليم العالي الإلكتروني. 

- الإشراف المباشر على صفحة مركز إحصاءات التعليم العالي على موقع وزارة التعليم العالي» 
ومتابعة تحديثها. 
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مدو قالطو واف دة u geal‏ الإداوة jg Mo dalall‏ 
اقتباس جزء من هذا الكتاب أو dole]‏ طبعه LL‏ صورة دون موافقة 


كتابية من المعهد؛ إلا في حالات الاقتباس القصير بغرض النقد 
والتحليل» مع وجوب SS‏ المصدر. 





تم التصميم والإخراج الفني والطباعة في 
الإدارة العامة للطباعة والنشر بمعهد الإدارة العامة - ١١١٠ه_‏ 


هذا الكتاب: 

db‏ هذا الكتاب ليقدّم لنا حصيلة وخلاصة خبرة مؤلفه الدكتور/ ديفيليس 
التي تزيد عن (0”) ble‏ في مجال القياس. حيث يهدف OLII‏ بصفة رئيسة إلى 
تسليط الضوء على المفاهيم والنظريات والاتجاهات التقليدية والحديثة المتعلقة 
بتطوير المقاييس في مجال البحث العلمي. deg‏ من أهم الكتب في مجال تطوير 
yaw lib!‏ ومن (Emr La ssl‏ 3 نسخته الأولى وفقاً موقع -Google Books‏ 


ويتمتع الكتابٌ بالعديد من امزايا أبرزها: إزالته للغموض واللبس الذي 
يعتري عملية القياس العلمي وبناء المقاييس في البحوث الاجتماعية والعلوم 
الأخرى IS‏ الصلة» من خلال التأكيد على الفهم المنطقي الدقيق للمفاهيم 
المرتبطة ببناء وتطوير المقاييس. كما يساعد الكتاب القراء على فهم الأساليب 
الحديثة للقياس وبناء المقاييس, ومقارنتها بالأساليب والطرق الكلاسيكيةء والفهم 
العميق للمزايا النسبية لكل منها. هذا عوضاً عن لغته السهلة الواضحة البعيدة 
عن الحسابات المعقدة وبالنالي فهو مصدرٌ للباحثين ذوي الخبرة والباحثين 
oS sit‏ والطلاب على slow do‏ 


ويتناول هذا الكتاب في طبعته الرابعة. المكونة من gad ASE‏ 
موضوعات جديدة SIS‏ صلة مناهج القياس الحديثة» منها على سبيل JEL)‏ 
بدائل معامل a"‏ والنموذج gd‏ العاملينء ونموذج العوامل الهرميء والأدوات 
المتاحة في البرامج الإحصائية SIS‏ العلاقة بتطوير المقاييس في البحوث العلمية. 
كما تضمّن Ades iii‏ وتمارين للمساعدة في التعلم وفهم أساسيات القياس. 
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